Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.11.17;
Скачать: CL | DM;

Вниз

Koi-Dos-Win   Найти похожие ветки 

 
SergeySEM ©   (2003-11-06 13:37) [0]

Мастера подскажите пожалуйста
как определить в каком формате текст в строке
заранее благодарен


 
panov ©   (2003-11-06 14:03) [1]

Статистическими методами...


 
SergeySEM ©   (2003-11-06 14:06) [2]

можно поподробнее


 
SergeySEM ©   (2003-11-06 14:06) [3]

можно поподробнее


 
Jel ©   (2003-11-06 14:18) [4]

Можно. Считай частоту повторения отдельных символов в строке и потом сравнивай наиболее часто встречающийся в тексте символ с буквами "е", "о" и "а" в разных кодировках. Вероятность определения кодировки тем выше, чем длиннее строка.


 
Kiril ©   (2003-11-06 14:26) [5]

Определять по согласным буквам, крайне редко после преобразования из одной кодировки в другую будут появлятся слова с 3, 4 гласными подряд.

Если после преобразования такие слова есть и их много значит преобразование не из той кодировки...

P.S. Компонента RusCod лежит вкладовке


 
SergeySEM ©   (2003-11-06 14:35) [6]

а можно ли еще быстрее
мне нужно перебрать 1000000... строк
разбить по словам (могу)
сравнить совпадения в БД (могу)
записать в БД новое (могу)
на 1000 строк у меня выходит ~1 сек
а если буду еще проверять таким способом :(


 
panov ©   (2003-11-06 14:37) [7]

Не обязательно весь текст обрабатывать.


 
SergeySEM ©   (2003-11-06 14:39) [8]

а у Делфи нету какой либо функции преобразовать текст в Win


 
Zacho ©   (2003-11-06 14:43) [9]


> SergeySEM © (06.11.03 14:39) [8]

Есть в WinAPI. RTFM OemToChar, OemToCharBuf и т.п.



Страницы: 1 вся ветка

Текущий архив: 2003.11.17;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.033 c
11-56551
race1
2003-02-25 18:50
2003.11.17
component


7-56937
webPauk
2003-09-03 17:00
2003.11.17
Console application


14-56831
Халява
2003-10-28 00:04
2003.11.17
Поможите


3-56492
Vemer
2003-10-26 11:01
2003.11.17
(Не)Работа TQRExpr


1-56614
amisare
2003-11-05 19:30
2003.11.17
Снова TFileStream