Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2002.07.25;
Скачать: [xml.tar.bz2];

Вниз

автоматическое определение кодировок   Найти похожие ветки 

 
Doctor Deejay   (2002-07-13 17:13) [0]

Как сделать автоматическое определение кодировок?
Например как в The Bat или IExplorer


 
Юрий Зотов   (2002-07-13 19:15) [1]

Просто использовать RichEdit.


 
Doctor Deejay   (2002-07-13 19:46) [2]

А он определяет их?
Какое свойство выдает данную кодировку и как её сменить?


 
Юрий Зотов   (2002-07-13 23:21) [3]

Да ничего не надо, он сам все сделает. Кривовато, правда, но работает. Для справки посмотрите его свойство SelAttributes (а в нем свойство CharSet) и в API - GetKeyboardLayout(Name) и ActivateKeyboardLayout.


 
Юрий Зотов   (2002-07-13 23:28) [4]

Стоп, я, кажется, не о том говорю. Только что дошло - Вам же нужно, наверное, Win1251, KOI8 и т.д. Тогда посмотрите здесь:
http://www.delphikingdom.com/treasury/decod.htm


 
Doctor Deejay   (2002-07-14 00:39) [5]

Вот и я о том же.
Конечно
> Вам же нужно, наверное, Win1251, KOI8 и т.д.



 
Doctor Deejay   (2002-07-14 00:45) [6]

Там только ручная перекодировка!
А в вопросе стоит автоматическая!
Как?


 
Юрий Зотов   (2002-07-14 00:52) [7]

Дык.. любая автоматика всегда ручками и делается, разве нет?
Алгоритмы там есть, кто мешает реализовать?


 
-=Sergeante=-   (2002-07-14 03:10) [8]

С просим у Евгения Рошаля? :)


 
Doctor Deejay   (2002-07-14 09:59) [9]

А он тут при чем?


 
vuk   (2002-07-14 12:15) [10]

Автоматически кодировку можно определить с использованием статистических методов. Если предположить, что имеем дело с русским языком, то для каждой кодировки будет своя средняя (определенная по нескольким текстам) частота встречаемости символов с определенными кодами. Поэтому если есть таблица частот для определенной кодировки и таблица частот для рассматриваемого текста, то можно приблизительно определить в какой кодировке данный текст. Причем, чем длинее распознаваемый текст, тем лучше результат распознавания.
В принципе можно повысить процент распознавания, если использовать таблицу частот встречаемости не одиночных символов, а их пар.



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2002.07.25;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.006 c
1-81266
Gala
2002-07-14 12:27
2002.07.25
отмена выделения текста в ячейке DBgrid


1-81354
Linload
2002-07-13 15:57
2002.07.25
Delhi FAQ


1-81332
BAY
2002-07-12 15:44
2002.07.25
Клавиатура


3-81132
Виталий Панасенко
2002-07-03 14:16
2002.07.25
D1+D5


14-81453
любитель
2002-06-25 11:16
2002.07.25
Нужен хороший проигрыватель avi чтобы в фуллскрине не тормозил.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский