Текущий архив: 2003.11.17;
Скачать: CL | DM;
ВнизKoi-Dos-Win Найти похожие ветки
← →
SergeySEM (2003-11-06 13:37) [0]Мастера подскажите пожалуйста
как определить в каком формате текст в строке
заранее благодарен
← →
panov (2003-11-06 14:03) [1]Статистическими методами...
← →
SergeySEM (2003-11-06 14:06) [2]можно поподробнее
← →
SergeySEM (2003-11-06 14:06) [3]можно поподробнее
← →
Jel (2003-11-06 14:18) [4]Можно. Считай частоту повторения отдельных символов в строке и потом сравнивай наиболее часто встречающийся в тексте символ с буквами "е", "о" и "а" в разных кодировках. Вероятность определения кодировки тем выше, чем длиннее строка.
← →
Kiril (2003-11-06 14:26) [5]Определять по согласным буквам, крайне редко после преобразования из одной кодировки в другую будут появлятся слова с 3, 4 гласными подряд.
Если после преобразования такие слова есть и их много значит преобразование не из той кодировки...
P.S. Компонента RusCod лежит вкладовке
← →
SergeySEM (2003-11-06 14:35) [6]а можно ли еще быстрее
мне нужно перебрать 1000000... строк
разбить по словам (могу)
сравнить совпадения в БД (могу)
записать в БД новое (могу)
на 1000 строк у меня выходит ~1 сек
а если буду еще проверять таким способом :(
← →
panov (2003-11-06 14:37) [7]Не обязательно весь текст обрабатывать.
← →
SergeySEM (2003-11-06 14:39) [8]а у Делфи нету какой либо функции преобразовать текст в Win
← →
Zacho (2003-11-06 14:43) [9]
> SergeySEM © (06.11.03 14:39) [8]
Есть в WinAPI. RTFM OemToChar, OemToCharBuf и т.п.
Страницы: 1 вся ветка
Текущий архив: 2003.11.17;
Скачать: CL | DM;
Память: 0.45 MB
Время: 0.008 c