Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2005.09.18;
Скачать: CL | DM;

Вниз

Как узнать в какой кодировке находится текст в файле.   Найти похожие ветки 

 
VID ©   (2005-08-26 11:52) [0]

Файл - *.txt.
Обычный текстовый файл, в котором текст может храниться в любой из кодировок.

Я хочу написать функцию которая текст из любой кодировки переведет в ANSI. Но для этого нужно знать кодировку исходного текста. А как это 100% узнать ?


 
Anatoly Podgoretsky ©   (2005-08-26 11:58) [1]

Статистический анализ, при условии знания языка, иначе вообще очень сложно.
Функция перевода простая, это просто цикл по строке
for I := 1 to Length(S) do
  S[I] := CvtTable[S[I]];


 
Alexander Panov ©   (2005-08-26 11:58) [2]

Узнать можно, проанализировав частоту, с которой появляются в тексте символы.
Но если нет необходимого объема для анализа - тогда никак.


 
Игорь Шевченко ©   (2005-08-26 11:58) [3]

Никак


 
Leonid Troyanovsky ©   (2005-08-26 12:27) [4]


> VID ©   (26.08.05 11:52)  

> переведет в ANSI. Но для этого нужно знать кодировку исходного
> текста. А как это 100% узнать ?


На 100% - нельзя.
Можно - с заданной вероятностью (при условии достаточности
длины текста).
Анализируются частота сочетаний символов: 2, 3 и т.д.
характерные для предполагаемого языка.
Пример можно найти на сайте Анатолия Подгорецкого,
в сборнике факов.

--
Regards, LVT.


 
имя   (2005-08-26 12:43) [5]

Удалено модератором


 
имя   (2005-08-26 12:56) [6]

Удалено модератором


 
Наиль ©   (2005-08-26 14:06) [7]

Делай как все. Предложи варианты расшифровки пользователю, а уж он разберётся.



Страницы: 1 вся ветка

Текущий архив: 2005.09.18;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.038 c
10-1103027870
Max_Zyuzin
2004-12-14 15:37
2005.09.18
Excel & COM


3-1123157438
VitaWED
2005-08-04 16:10
2005.09.18
SQL и память


1-1125061020
Scorpio
2005-08-26 16:57
2005.09.18
Копирование файлов


4-1121936114
supervk
2005-07-21 12:55
2005.09.18
проверка готовности принтера LPT


14-1125043833
Ega23
2005-08-26 12:10
2005.09.18
Как настроить Word, чтобы он не выпендривался?