Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2002.07.25;
Скачать: [xml.tar.bz2];

Вниз

автоматическое определение кодировок   Найти похожие ветки 

 
Doctor Deejay   (2002-07-13 17:13) [0]

Как сделать автоматическое определение кодировок?
Например как в The Bat или IExplorer


 
Юрий Зотов   (2002-07-13 19:15) [1]

Просто использовать RichEdit.


 
Doctor Deejay   (2002-07-13 19:46) [2]

А он определяет их?
Какое свойство выдает данную кодировку и как её сменить?


 
Юрий Зотов   (2002-07-13 23:21) [3]

Да ничего не надо, он сам все сделает. Кривовато, правда, но работает. Для справки посмотрите его свойство SelAttributes (а в нем свойство CharSet) и в API - GetKeyboardLayout(Name) и ActivateKeyboardLayout.


 
Юрий Зотов   (2002-07-13 23:28) [4]

Стоп, я, кажется, не о том говорю. Только что дошло - Вам же нужно, наверное, Win1251, KOI8 и т.д. Тогда посмотрите здесь:
http://www.delphikingdom.com/treasury/decod.htm


 
Doctor Deejay   (2002-07-14 00:39) [5]

Вот и я о том же.
Конечно
> Вам же нужно, наверное, Win1251, KOI8 и т.д.



 
Doctor Deejay   (2002-07-14 00:45) [6]

Там только ручная перекодировка!
А в вопросе стоит автоматическая!
Как?


 
Юрий Зотов   (2002-07-14 00:52) [7]

Дык.. любая автоматика всегда ручками и делается, разве нет?
Алгоритмы там есть, кто мешает реализовать?


 
-=Sergeante=-   (2002-07-14 03:10) [8]

С просим у Евгения Рошаля? :)


 
Doctor Deejay   (2002-07-14 09:59) [9]

А он тут при чем?


 
vuk   (2002-07-14 12:15) [10]

Автоматически кодировку можно определить с использованием статистических методов. Если предположить, что имеем дело с русским языком, то для каждой кодировки будет своя средняя (определенная по нескольким текстам) частота встречаемости символов с определенными кодами. Поэтому если есть таблица частот для определенной кодировки и таблица частот для рассматриваемого текста, то можно приблизительно определить в какой кодировке данный текст. Причем, чем длинее распознаваемый текст, тем лучше результат распознавания.
В принципе можно повысить процент распознавания, если использовать таблицу частот встречаемости не одиночных символов, а их пар.



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2002.07.25;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.008 c
3-81187
Nebula
2002-07-04 14:53
2002.07.25
IB


14-81467
jin-jon1
2002-06-20 15:59
2002.07.25
Где найти в интернете программу Delphi.


8-81387
Devid
2002-03-12 18:00
2002.07.25
Как заисать


14-81484
Man-In-Red
2002-06-28 21:20
2002.07.25
Возможно ли это…


3-81154
Дундук
2002-07-04 08:23
2002.07.25
Переместить указатель





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский