Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2002.11.11;
Скачать: CL | DM;

Вниз

Как узнать в какой кодировке находиться файл....   Найти похожие ветки 

 
Anonimus   (2002-10-30 14:18) [0]

Драсти..!!!!

Подскажите пожалуйста как мне узнать в каой кодировки находиться файл..?????
Файл текстовый....

Заранее спасибо...


 
Smithson ©   (2002-10-30 14:40) [1]

Очень просто. Я тут уже где-то давал алгоритм. Идея в следующем - для каждой кодировки составить таблицу ПАР символов. Взять некий большой файл, записать его в разных кодировках и посчитать такие таблицы для разных кодировок (плюс сохранить количество символов в файле всего).
структура типа

TCharSetTable = record
N: Integer; // число символов
CharSet: Array["а".."я","а".."я"] of Integer;
// Таблица пар
end;


Далее для своего файла считываешь байт 300-500 (я делал 500, точность выше), считаешь для него аналогичную таблицу. И сравниваешь эти таблицы (эталонные и для файла), учитывая количество символов (я использовал их как делители для элементов таблицы). Для неправильных кодировок расхождение с эталоном будет разительное, для правильной - небольшое.


 
Opuhshii ©   (2002-10-30 14:43) [2]

100% - никак,..
с какой то вероятностью можно утверждать по наличию отсутствия не присущих кодировке символов,.. пример (win1251/cp866) в файле последеней не должно быть байту $FF,. хотя может и быть,.. ;)



Страницы: 1 вся ветка

Текущий архив: 2002.11.11;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.022 c
7-34268
Дениска
2002-09-09 21:35
2002.11.11
Передача сообщений с одного компа на др.


7-34262
ResTec
2002-09-06 02:16
2002.11.11
Как определить загрузку процессора: процеса?, потока (нити)?


1-34024
Ghost!
2002-10-30 16:50
2002.11.11
нижняя Random граница


1-34075
mazepa
2002-10-30 22:42
2002.11.11
save


1-34084
liho26
2002-10-31 10:48
2002.11.11
Каретка возвращается!