Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2002.11.11;
Скачать: CL | DM;

Вниз

Как узнать в какой кодировке находиться файл....   Найти похожие ветки 

 
Anonimus   (2002-10-30 14:18) [0]

Драсти..!!!!

Подскажите пожалуйста как мне узнать в каой кодировки находиться файл..?????
Файл текстовый....

Заранее спасибо...


 
Smithson ©   (2002-10-30 14:40) [1]

Очень просто. Я тут уже где-то давал алгоритм. Идея в следующем - для каждой кодировки составить таблицу ПАР символов. Взять некий большой файл, записать его в разных кодировках и посчитать такие таблицы для разных кодировок (плюс сохранить количество символов в файле всего).
структура типа

TCharSetTable = record
N: Integer; // число символов
CharSet: Array["а".."я","а".."я"] of Integer;
// Таблица пар
end;


Далее для своего файла считываешь байт 300-500 (я делал 500, точность выше), считаешь для него аналогичную таблицу. И сравниваешь эти таблицы (эталонные и для файла), учитывая количество символов (я использовал их как делители для элементов таблицы). Для неправильных кодировок расхождение с эталоном будет разительное, для правильной - небольшое.


 
Opuhshii ©   (2002-10-30 14:43) [2]

100% - никак,..
с какой то вероятностью можно утверждать по наличию отсутствия не присущих кодировке символов,.. пример (win1251/cp866) в файле последеней не должно быть байту $FF,. хотя может и быть,.. ;)



Страницы: 1 вся ветка

Текущий архив: 2002.11.11;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.016 c
1-33941
IGray
2002-11-01 03:26
2002.11.11
Гамма-коррекция ЯРКОСТИ (а не КОНТРАСТА) нужна..


1-34100
Ghost!
2002-10-30 22:00
2002.11.11
сложный вопрос


8-34133
ALFA
2002-07-19 19:55
2002.11.11
Как программно нарисовать стрелку


6-34154
Metallica
2002-09-07 18:18
2002.11.11
Как проверить существование страницы в интернет, используя NMHTTP


3-33883
123000
2002-10-21 17:53
2002.11.11
Установка алиасов