Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2002.07.25;
Скачать: [xml.tar.bz2];

Вниз

автоматическое определение кодировок   Найти похожие ветки 

 
Doctor Deejay   (2002-07-13 17:13) [0]

Как сделать автоматическое определение кодировок?
Например как в The Bat или IExplorer


 
Юрий Зотов   (2002-07-13 19:15) [1]

Просто использовать RichEdit.


 
Doctor Deejay   (2002-07-13 19:46) [2]

А он определяет их?
Какое свойство выдает данную кодировку и как её сменить?


 
Юрий Зотов   (2002-07-13 23:21) [3]

Да ничего не надо, он сам все сделает. Кривовато, правда, но работает. Для справки посмотрите его свойство SelAttributes (а в нем свойство CharSet) и в API - GetKeyboardLayout(Name) и ActivateKeyboardLayout.


 
Юрий Зотов   (2002-07-13 23:28) [4]

Стоп, я, кажется, не о том говорю. Только что дошло - Вам же нужно, наверное, Win1251, KOI8 и т.д. Тогда посмотрите здесь:
http://www.delphikingdom.com/treasury/decod.htm


 
Doctor Deejay   (2002-07-14 00:39) [5]

Вот и я о том же.
Конечно
> Вам же нужно, наверное, Win1251, KOI8 и т.д.



 
Doctor Deejay   (2002-07-14 00:45) [6]

Там только ручная перекодировка!
А в вопросе стоит автоматическая!
Как?


 
Юрий Зотов   (2002-07-14 00:52) [7]

Дык.. любая автоматика всегда ручками и делается, разве нет?
Алгоритмы там есть, кто мешает реализовать?


 
-=Sergeante=-   (2002-07-14 03:10) [8]

С просим у Евгения Рошаля? :)


 
Doctor Deejay   (2002-07-14 09:59) [9]

А он тут при чем?


 
vuk   (2002-07-14 12:15) [10]

Автоматически кодировку можно определить с использованием статистических методов. Если предположить, что имеем дело с русским языком, то для каждой кодировки будет своя средняя (определенная по нескольким текстам) частота встречаемости символов с определенными кодами. Поэтому если есть таблица частот для определенной кодировки и таблица частот для рассматриваемого текста, то можно приблизительно определить в какой кодировке данный текст. Причем, чем длинее распознаваемый текст, тем лучше результат распознавания.
В принципе можно повысить процент распознавания, если использовать таблицу частот встречаемости не одиночных символов, а их пар.



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2002.07.25;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.009 c
1-81270
garry
2002-07-15 12:49
2002.07.25
Поиск директорий....


1-81224
Help
2002-07-13 20:02
2002.07.25
Как в Memo вставить текст при нажатии...


14-81415
dimanew
2002-06-27 07:31
2002.07.25
Подскажите пожайуста где можно почитать об ОС


1-81258
Alex_win
2002-07-15 09:19
2002.07.25
версия фала


1-81313
Loco
2002-07-12 15:29
2002.07.25
НУ БЛИН!!!!!!!!! Locate





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский