Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2005.06.06;
Скачать: CL | DM;

Вниз

notepad (Блокнот ) и Utf8   Найти похожие ветки 

 
КиТаЯц ©   (2005-05-24 08:09) [0]

Значит так...
Экспортировал данные в TXT. Данные должны быть в UTF8. Все нормально. Добавил заголовок, типа "здесь данные для того-то и того-то". Открываю текстовик в блокноте - все ОК. Текст читабельно-правительный.

Открываю в TotalCommandere через F3. Текст - кракозябры. Надо нажать последовательно на "A" (ANSI) и потом на "7" (utf-8).
Нормально думаю... Надо в заголовок несколько строк добавить не в не в UTF-8 чтобы юзер мог сразу прочитать что здесь находится.

Добавил. Открываем в листере тоталкоммандера: комментарий - ОК, данные (UTF-8) - кракозябры. Все как и задумывалось.
Но... Теперь при открытии в блокноте происходит тоже самое! И текст в UTF-8 править нельзя!

Вопрос: как notepad определяет кодировку текста? По каким-то ключевым символам? Как сделать, чтобы полюбому txt открывался в блокноте как UTF-8? Что надо в этот TXT-шник вписать? Куда?

Спасибо.


 
ЮЮ ©   (2005-05-24 08:23) [1]

>Надо в заголовок несколько строк добавить не в не в UTF-8 чтобы юзер мог сразу прочитать что здесь находится.

Текстовый файл не иожет содержать текст в нескольких кодировках.


 
VMcL ©   (2005-05-24 08:24) [2]

http://www.unicode.org/

?


 
КиТаЯц ©   (2005-05-24 08:28) [3]

> ЮЮ © (24.05.05 08:23) [1]
Серьезно?
Жаль я не знал...
Знал бы не тратил время когда писал в *.diz файлах комментарии на win1251 + cpp866 чтобы юзер мог и из под винды и из под dos понять что там написано.


 
КиТаЯц ©   (2005-05-24 08:41) [4]

> VMcL ©   (24.05.05 08:24) [2]
Спасибо. Не то немного.
Перефразирую вопрос:
"Как программа notepad (блокнот) определяет кодировку открываемого *.txt файла? По каким ключевым символам в каком месте?"


 
VMcL ©   (2005-05-24 08:44) [5]

>>КиТаЯц ©   (24.05.05 08:41) [4]

>Как программа notepad (блокнот) определяет кодировку открываемого *.txt файла? По каким ключевым символам в каком месте?"

Правда известна только Гейтсу с Ко и дизассемблеру, но подозреваю, что по нескольким первым символам.


 
alex-drob   (2005-05-24 08:54) [6]

Скорее всего по первым символам. Если сохранить в блокноте текст в utf-8, а потом открыть word`ом в кодировке кирилица windows то эти символы видны.


 
VMcL ©   (2005-05-24 08:59) [7]

>>alex-drob   (24.05.05 08:54) [6]

Если Вы имеете в виду EF BB BF, то Notepad и без них определяет UTF-8.


 
КиТаЯц ©   (2005-05-24 09:01) [8]

>VMcL ©   (24.05.05 08:44) [5]
>alex-drob   (24.05.05 08:54) [6]

:) Вот и я так же подозревал. Нихт. Lister TotalCommandera точно по первым символам...

Похоже он ищет во всем тексте сначала симовлы ANSI, а потом уже (если не нашел) Юникод, Юникод Big Еndian и UTF-8. Скорее всего именно в этом порядке... Не утверждаю. Версия.


 
alex-drob   (2005-05-24 09:08) [9]

После выполнения этого кода:

assignfile(f,"d:\1.txt");
rewrite(f);
s:="п»їqwer";
write(f,s);
closefile(f);


В файл сохранится "qwer" в кодеровке UTF-8.
А после этого:
assignfile(f,"d:\1.txt");
rewrite(f);
s:="qwer";
write(f,s);
closefile(f);

В ANSI


 
Чапаев ©   (2005-05-24 09:52) [10]

Сохрани ПУСТОЙ файл в различных кодировках и посмотри, что в него записано. ;-)


 
VMcL ©   (2005-05-24 10:41) [11]

>>Чапаев ©   (24.05.05 09:52) [10]

Боюсь ошибиться, но, по-моему, там будут байты
=)


 
Игорь Шевченко ©   (2005-05-24 10:52) [12]

В начале файла 2 байта определяют кодировку. И все.


 
VMcL ©   (2005-05-24 10:54) [13]

>>Игорь Шевченко ©   (24.05.05 10:52) [12]

См. [7].


 
Игорь Шевченко ©   (2005-05-24 11:26) [14]

VMcL ©   (24.05.05 10:54) [13]

http://www.unicode.org/faq/utf_bom.html


 
Eraser ©   (2005-05-24 11:33) [15]

КиТаЯц ©   (24.05.05 08:09)

Я всегда говорил, что тотал командер - #$$$# (цезура).
имхо окошки удобнее. Не зрая виндовоз и никсы (и не только) именно с оконным интерфейсом.


 
Newbie   (2005-05-24 12:24) [16]

КиТаЯц ©   (24.05.05 08:09)
Вариант: повесить в TC на F3 (или Alt-F3) View64 вместо встроенного Lister. Автоматически распознает практически все существующие кодировки и их разновидности, в частности UTF-8.



Страницы: 1 вся ветка

Текущий архив: 2005.06.06;
Скачать: CL | DM;

Наверх




Память: 0.5 MB
Время: 0.03 c
4-1113459164
Кот Бегемот
2005-04-14 10:12
2005.06.06
Как вставить иконку в трей (туда где часики) ?


14-1116503646
syte_ser78
2005-05-19 15:54
2005.06.06
Алгоритм разбивки экселевской таблици


3-1114504022
-=Domix=-
2005-04-26 12:27
2005.06.06
Запрос с ХП


1-1115690376
Shredder
2005-05-10 05:59
2005.06.06
Шифрование с открытым ключом


14-1116241435
ANB
2005-05-16 15:03
2005.06.06
Хочу опять в СССР