Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2003.11.17;
Скачать: [xml.tar.bz2];

Вниз

Koi-Dos-Win   Найти похожие ветки 

 
SergeySEM   (2003-11-06 13:37) [0]

Мастера подскажите пожалуйста
как определить в каком формате текст в строке
заранее благодарен


 
panov   (2003-11-06 14:03) [1]

Статистическими методами...


 
SergeySEM   (2003-11-06 14:06) [2]

можно поподробнее


 
SergeySEM   (2003-11-06 14:06) [3]

можно поподробнее


 
Jel   (2003-11-06 14:18) [4]

Можно. Считай частоту повторения отдельных символов в строке и потом сравнивай наиболее часто встречающийся в тексте символ с буквами "е", "о" и "а" в разных кодировках. Вероятность определения кодировки тем выше, чем длиннее строка.


 
Kiril   (2003-11-06 14:26) [5]

Определять по согласным буквам, крайне редко после преобразования из одной кодировки в другую будут появлятся слова с 3, 4 гласными подряд.

Если после преобразования такие слова есть и их много значит преобразование не из той кодировки...

P.S. Компонента RusCod лежит вкладовке


 
SergeySEM   (2003-11-06 14:35) [6]

а можно ли еще быстрее
мне нужно перебрать 1000000... строк
разбить по словам (могу)
сравнить совпадения в БД (могу)
записать в БД новое (могу)
на 1000 строк у меня выходит ~1 сек
а если буду еще проверять таким способом :(


 
panov   (2003-11-06 14:37) [7]

Не обязательно весь текст обрабатывать.


 
SergeySEM   (2003-11-06 14:39) [8]

а у Делфи нету какой либо функции преобразовать текст в Win


 
Zacho   (2003-11-06 14:43) [9]


> SergeySEM © (06.11.03 14:39) [8]

Есть в WinAPI. RTFM OemToChar, OemToCharBuf и т.п.



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2003.11.17;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.017 c
1-56760
slivka
2003-11-06 14:09
2003.11.17
Проблема с циклoм For To do.


4-56965
zagzag
2003-08-05 12:51
2003.11.17
Наложение цветов и прозрачность


14-56878
Kotka
2003-10-26 19:01
2003.11.17
---|Ветка была без названия|---


1-56573
Cosinus
2003-11-06 11:51
2003.11.17
Совместимость версий Delphi


3-56436
paul_k
2003-10-27 09:26
2003.11.17
Помогите разобратся в структуре





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский