Форум: "Основная";
Текущий архив: 2002.07.25;
Скачать: [xml.tar.bz2];
Внизавтоматическое определение кодировок Найти похожие ветки
← →
Doctor Deejay (2002-07-13 17:13) [0]Как сделать автоматическое определение кодировок?
Например как в The Bat или IExplorer
← →
Юрий Зотов (2002-07-13 19:15) [1]Просто использовать RichEdit.
← →
Doctor Deejay (2002-07-13 19:46) [2]
А он определяет их?
Какое свойство выдает данную кодировку и как её сменить?
← →
Юрий Зотов (2002-07-13 23:21) [3]Да ничего не надо, он сам все сделает. Кривовато, правда, но работает. Для справки посмотрите его свойство SelAttributes (а в нем свойство CharSet) и в API - GetKeyboardLayout(Name) и ActivateKeyboardLayout.
← →
Юрий Зотов (2002-07-13 23:28) [4]Стоп, я, кажется, не о том говорю. Только что дошло - Вам же нужно, наверное, Win1251, KOI8 и т.д. Тогда посмотрите здесь:
http://www.delphikingdom.com/treasury/decod.htm
← →
Doctor Deejay (2002-07-14 00:39) [5]Вот и я о том же.
Конечно
> Вам же нужно, наверное, Win1251, KOI8 и т.д.
← →
Doctor Deejay (2002-07-14 00:45) [6]Там только ручная перекодировка!
А в вопросе стоит автоматическая!
Как?
← →
Юрий Зотов (2002-07-14 00:52) [7]Дык.. любая автоматика всегда ручками и делается, разве нет?
Алгоритмы там есть, кто мешает реализовать?
← →
-=Sergeante=- (2002-07-14 03:10) [8]С просим у Евгения Рошаля? :)
← →
Doctor Deejay (2002-07-14 09:59) [9]А он тут при чем?
← →
vuk (2002-07-14 12:15) [10]Автоматически кодировку можно определить с использованием статистических методов. Если предположить, что имеем дело с русским языком, то для каждой кодировки будет своя средняя (определенная по нескольким текстам) частота встречаемости символов с определенными кодами. Поэтому если есть таблица частот для определенной кодировки и таблица частот для рассматриваемого текста, то можно приблизительно определить в какой кодировке данный текст. Причем, чем длинее распознаваемый текст, тем лучше результат распознавания.
В принципе можно повысить процент распознавания, если использовать таблицу частот встречаемости не одиночных символов, а их пар.
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2002.07.25;
Скачать: [xml.tar.bz2];
Память: 0.46 MB
Время: 0.009 c