Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2002.11.11;
Скачать: CL | DM;

Вниз

Как узнать в какой кодировке находиться файл....   Найти похожие ветки 

 
Anonimus   (2002-10-30 14:18) [0]

Драсти..!!!!

Подскажите пожалуйста как мне узнать в каой кодировки находиться файл..?????
Файл текстовый....

Заранее спасибо...


 
Smithson ©   (2002-10-30 14:40) [1]

Очень просто. Я тут уже где-то давал алгоритм. Идея в следующем - для каждой кодировки составить таблицу ПАР символов. Взять некий большой файл, записать его в разных кодировках и посчитать такие таблицы для разных кодировок (плюс сохранить количество символов в файле всего).
структура типа

TCharSetTable = record
N: Integer; // число символов
CharSet: Array["а".."я","а".."я"] of Integer;
// Таблица пар
end;


Далее для своего файла считываешь байт 300-500 (я делал 500, точность выше), считаешь для него аналогичную таблицу. И сравниваешь эти таблицы (эталонные и для файла), учитывая количество символов (я использовал их как делители для элементов таблицы). Для неправильных кодировок расхождение с эталоном будет разительное, для правильной - небольшое.


 
Opuhshii ©   (2002-10-30 14:43) [2]

100% - никак,..
с какой то вероятностью можно утверждать по наличию отсутствия не присущих кодировке символов,.. пример (win1251/cp866) в файле последеней не должно быть байту $FF,. хотя может и быть,.. ;)



Страницы: 1 вся ветка

Текущий архив: 2002.11.11;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.032 c
3-33901
Dimedrol
2002-10-21 22:58
2002.11.11
DBGrid + Wrap text


6-34142
CrazyAngel
2002-09-12 17:33
2002.11.11
Маленький e-мail :)


14-34209
AL2002
2002-10-22 15:54
2002.11.11
Кто знает?..


7-34266
Юрий К
2002-09-06 10:12
2002.11.11
Совместимость мдем PCI и COM мышь


7-34283
OxOTHuK
2002-09-07 22:02
2002.11.11
Реестр господа...