Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2002.07.25;
Скачать: CL | DM;

Вниз

автоматическое определение кодировок   Найти похожие ветки 

 
Doctor Deejay ©   (2002-07-13 17:13) [0]

Как сделать автоматическое определение кодировок?
Например как в The Bat или IExplorer


 
Юрий Зотов ©   (2002-07-13 19:15) [1]

Просто использовать RichEdit.


 
Doctor Deejay ©   (2002-07-13 19:46) [2]

А он определяет их?
Какое свойство выдает данную кодировку и как её сменить?


 
Юрий Зотов ©   (2002-07-13 23:21) [3]

Да ничего не надо, он сам все сделает. Кривовато, правда, но работает. Для справки посмотрите его свойство SelAttributes (а в нем свойство CharSet) и в API - GetKeyboardLayout(Name) и ActivateKeyboardLayout.


 
Юрий Зотов ©   (2002-07-13 23:28) [4]

Стоп, я, кажется, не о том говорю. Только что дошло - Вам же нужно, наверное, Win1251, KOI8 и т.д. Тогда посмотрите здесь:
http://www.delphikingdom.com/treasury/decod.htm


 
Doctor Deejay ©   (2002-07-14 00:39) [5]

Вот и я о том же.
Конечно
> Вам же нужно, наверное, Win1251, KOI8 и т.д.



 
Doctor Deejay ©   (2002-07-14 00:45) [6]

Там только ручная перекодировка!
А в вопросе стоит автоматическая!
Как?


 
Юрий Зотов ©   (2002-07-14 00:52) [7]

Дык.. любая автоматика всегда ручками и делается, разве нет?
Алгоритмы там есть, кто мешает реализовать?


 
-=Sergeante=- ©   (2002-07-14 03:10) [8]

С просим у Евгения Рошаля? :)


 
Doctor Deejay ©   (2002-07-14 09:59) [9]

А он тут при чем?


 
vuk ©   (2002-07-14 12:15) [10]

Автоматически кодировку можно определить с использованием статистических методов. Если предположить, что имеем дело с русским языком, то для каждой кодировки будет своя средняя (определенная по нескольким текстам) частота встречаемости символов с определенными кодами. Поэтому если есть таблица частот для определенной кодировки и таблица частот для рассматриваемого текста, то можно приблизительно определить в какой кодировке данный текст. Причем, чем длинее распознаваемый текст, тем лучше результат распознавания.
В принципе можно повысить процент распознавания, если использовать таблицу частот встречаемости не одиночных символов, а их пар.



Страницы: 1 вся ветка

Текущий архив: 2002.07.25;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.015 c
3-81199
Grrey
2002-07-02 18:46
2002.07.25
Классическая ситуация


1-81342
Src_Crab
2002-07-12 20:52
2002.07.25
Преобразование String в Integer.


3-81126
Grrey
2002-07-02 15:32
2002.07.25
Как удалить UDF в IB базе?


8-81389
Vvedensk
2002-03-15 14:23
2002.07.25
Как увеличить изображения с малой потерью качества подобно таму как это делает PhotoShop


1-81290
AL2002
2002-07-11 20:53
2002.07.25
Скажите, а как узнать размер массива?