Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.11.17;
Скачать: CL | DM;

Вниз

Koi-Dos-Win   Найти похожие ветки 

 
SergeySEM ©   (2003-11-06 13:37) [0]

Мастера подскажите пожалуйста
как определить в каком формате текст в строке
заранее благодарен


 
panov ©   (2003-11-06 14:03) [1]

Статистическими методами...


 
SergeySEM ©   (2003-11-06 14:06) [2]

можно поподробнее


 
SergeySEM ©   (2003-11-06 14:06) [3]

можно поподробнее


 
Jel ©   (2003-11-06 14:18) [4]

Можно. Считай частоту повторения отдельных символов в строке и потом сравнивай наиболее часто встречающийся в тексте символ с буквами "е", "о" и "а" в разных кодировках. Вероятность определения кодировки тем выше, чем длиннее строка.


 
Kiril ©   (2003-11-06 14:26) [5]

Определять по согласным буквам, крайне редко после преобразования из одной кодировки в другую будут появлятся слова с 3, 4 гласными подряд.

Если после преобразования такие слова есть и их много значит преобразование не из той кодировки...

P.S. Компонента RusCod лежит вкладовке


 
SergeySEM ©   (2003-11-06 14:35) [6]

а можно ли еще быстрее
мне нужно перебрать 1000000... строк
разбить по словам (могу)
сравнить совпадения в БД (могу)
записать в БД новое (могу)
на 1000 строк у меня выходит ~1 сек
а если буду еще проверять таким способом :(


 
panov ©   (2003-11-06 14:37) [7]

Не обязательно весь текст обрабатывать.


 
SergeySEM ©   (2003-11-06 14:39) [8]

а у Делфи нету какой либо функции преобразовать текст в Win


 
Zacho ©   (2003-11-06 14:43) [9]


> SergeySEM © (06.11.03 14:39) [8]

Есть в WinAPI. RTFM OemToChar, OemToCharBuf и т.п.



Страницы: 1 вся ветка

Текущий архив: 2003.11.17;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.056 c
8-56770
SergeSV
2003-07-19 17:46
2003.11.17
360-ти градусная фотография


3-56491
Ozone
2003-10-27 11:02
2003.11.17
ADO


14-56873
Dimaz-z
2003-10-26 15:01
2003.11.17
Помогите, никто не знает, где найти документацию по vCard?


14-56877
superior
2003-10-26 15:17
2003.11.17
Как узнать параметр с которым запущена моя программа???


14-56860
Dimonnn
2003-10-26 10:39
2003.11.17
MSDN