Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2002.07.08;
Скачать: [xml.tar.bz2];

Вниз

Автоопределение кодировки (866 vs 1251)   Найти похожие ветки 

 
Voldemar   (2002-06-26 17:41) [0]

Доброе время суток!
Существуют ли признаки, по которым можно определить в какой кодировке представлен текст хотя бы с удовлетворительной точностью? Или алгоритм определения, желательно не использующий словарь...

<offtop>А куда делся раздел "Алгоритмы"? Или он мне приснился?:)</offtop>


 
Виктор Щербаков   (2002-06-26 17:44) [1]

Частотный анализ называется по-моему.
Т.е. кодировка определяется по частоте использования в тексте определенных (или всех) символов.



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2002.07.08;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.44 MB
Время: 0.008 c
1-23594
Fly`
2002-06-25 12:46
2002.07.08
RichEdit, SelStart, Lines


7-23814
Goblinus
2002-04-16 15:59
2002.07.08
Как выдвинуть дверцу CD-ROM a?


3-23509
3asys
2002-06-16 23:33
2002.07.08
Кодировка при использовании ADO


4-23824
Artemkin
2002-05-08 07:21
2002.07.08
TTreeview


7-23805
JohnKorsh
2002-04-10 08:10
2002.07.08
Работа с последовательными портами.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский