Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.06.04;
Скачать: CL | DM;

Вниз

Юникод   Найти похожие ветки 

 
AlexanderMS ©   (2006-05-15 19:56) [0]

Скажите, пожалуйста, как представлены символы в формате Юникод? Я знаю, что двумя байтами и что латинская буква в Юникоде представлена тем же байтом, да + нулевой. Но с русским иначе. Мне нужно считать строку в кодировке Юникод из файла, используя TFileStream. Как это сделать? Заранее спасибо.


 
palva ©   (2006-05-15 20:12) [1]

Если это действительно UNICODE, а не UTF-8, то так и читайте: по два байта, укладывая каждую пару в символ PChar. В первых двух байтах файла находится служебная информация, которая говорит о том, в каком порядке идут байты в каждой паре, LittleEndian или BigEndian.


 
AlexanderMS ©   (2006-05-15 20:14) [2]

Спасибо. А если это - UTF-8?


 
Шпиён   (2006-05-15 20:34) [3]

Для общего развития -)
http://ru.wikipedia.org/wiki/Unicode

Для пратического применения F1:
Utf8ToAnsi
WideChar, WideString
WideCharToString
WideCharLenToString


 
AlexanderMS ©   (2006-05-15 20:41) [4]

Я не знаю, какая кодировка в файле. Он - смешанный: часть - обычная, часть - с двумя байтами. Вот с двумя, так выглядит в текстовом редакторе:

1я0я)я7я7яЯя7я<я/я$я

Через XOR 255 и удаления ненужного получается:

ОПЦИИ ИГРЫ

Вот другая разновидность (файл другой версии):

быаыЩызызыЯязымыЯыФы

Должно получится то же самое, но заставить программу расшифровать не могу. Это - часть CSF файла, языкового файла игры Generals. Я создаю редактор файлов этого формата. Одни файлы читает, другие нет.

Это что за кодировка?


 
AlexanderMS ©   (2006-05-15 20:42) [5]

Шпиён   (15.05.06 20:34) [3]

Спасибо за ссылку!


 
AlexanderMS ©   (2006-05-15 20:48) [6]

[5]
Не подумайте, что нашёл ответ, вопрос остался.


 
AlexanderMS ©   (2006-05-15 20:48) [7]

[5]
Не подумайте, что нашёл ответ, вопрос остался.



Страницы: 1 вся ветка

Текущий архив: 2006.06.04;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.034 c
3-1145011975
Владимир
2006-04-14 14:52
2006.06.04
Проблема в MySQL с Regexp и кодеровкой cp1251.


6-1138960505
DelphiN!
2006-02-03 12:55
2006.06.04
Сомастоятельная обработка ошибок в idPOP3 Indy10


3-1144923811
Dust
2006-04-13 14:23
2006.06.04
Кол-во уникальных записей в таблице MS Access


1-1145815933
Frostik
2006-04-23 22:12
2006.06.04
Получение вывода DOS-приложения в реальном времени


2-1147939972
elena_pp
2006-05-18 12:12
2006.06.04
Как узнать и записать версию exe-ника в строковую переменную?