Форум: "Основная";
Текущий архив: 2005.06.06;
Скачать: [xml.tar.bz2];
Внизnotepad (Блокнот ) и Utf8 Найти похожие ветки
← →
КиТаЯц © (2005-05-24 08:09) [0]Значит так...
Экспортировал данные в TXT. Данные должны быть в UTF8. Все нормально. Добавил заголовок, типа "здесь данные для того-то и того-то". Открываю текстовик в блокноте - все ОК. Текст читабельно-правительный.
Открываю в TotalCommandere через F3. Текст - кракозябры. Надо нажать последовательно на "A" (ANSI) и потом на "7" (utf-8).
Нормально думаю... Надо в заголовок несколько строк добавить не в не в UTF-8 чтобы юзер мог сразу прочитать что здесь находится.
Добавил. Открываем в листере тоталкоммандера: комментарий - ОК, данные (UTF-8) - кракозябры. Все как и задумывалось.
Но... Теперь при открытии в блокноте происходит тоже самое! И текст в UTF-8 править нельзя!
Вопрос: как notepad определяет кодировку текста? По каким-то ключевым символам? Как сделать, чтобы полюбому txt открывался в блокноте как UTF-8? Что надо в этот TXT-шник вписать? Куда?
Спасибо.
← →
ЮЮ © (2005-05-24 08:23) [1]>Надо в заголовок несколько строк добавить не в не в UTF-8 чтобы юзер мог сразу прочитать что здесь находится.
Текстовый файл не иожет содержать текст в нескольких кодировках.
← →
VMcL © (2005-05-24 08:24) [2]http://www.unicode.org/
?
← →
КиТаЯц © (2005-05-24 08:28) [3]> ЮЮ © (24.05.05 08:23) [1]
Серьезно?
Жаль я не знал...
Знал бы не тратил время когда писал в *.diz файлах комментарии на win1251 + cpp866 чтобы юзер мог и из под винды и из под dos понять что там написано.
← →
КиТаЯц © (2005-05-24 08:41) [4]> VMcL © (24.05.05 08:24) [2]
Спасибо. Не то немного.
Перефразирую вопрос:
"Как программа notepad (блокнот) определяет кодировку открываемого *.txt файла? По каким ключевым символам в каком месте?"
← →
VMcL © (2005-05-24 08:44) [5]>>КиТаЯц © (24.05.05 08:41) [4]
>Как программа notepad (блокнот) определяет кодировку открываемого *.txt файла? По каким ключевым символам в каком месте?"
Правда известна только Гейтсу с Ко и дизассемблеру, но подозреваю, что по нескольким первым символам.
← →
alex-drob (2005-05-24 08:54) [6]Скорее всего по первым символам. Если сохранить в блокноте текст в utf-8, а потом открыть word`ом в кодировке кирилица windows то эти символы видны.
← →
VMcL © (2005-05-24 08:59) [7]>>alex-drob (24.05.05 08:54) [6]
Если Вы имеете в виду EF BB BF, то Notepad и без них определяет UTF-8.
← →
КиТаЯц © (2005-05-24 09:01) [8]>VMcL © (24.05.05 08:44) [5]
>alex-drob (24.05.05 08:54) [6]
:) Вот и я так же подозревал. Нихт. Lister TotalCommandera точно по первым символам...
Похоже он ищет во всем тексте сначала симовлы ANSI, а потом уже (если не нашел) Юникод, Юникод Big Еndian и UTF-8. Скорее всего именно в этом порядке... Не утверждаю. Версия.
← →
alex-drob (2005-05-24 09:08) [9]После выполнения этого кода:
assignfile(f,"d:\1.txt");
rewrite(f);
s:="п»їqwer";
write(f,s);
closefile(f);
В файл сохранится "qwer" в кодеровке UTF-8.
А после этого:assignfile(f,"d:\1.txt");
rewrite(f);
s:="qwer";
write(f,s);
closefile(f);
В ANSI
← →
Чапаев © (2005-05-24 09:52) [10]Сохрани ПУСТОЙ файл в различных кодировках и посмотри, что в него записано. ;-)
← →
VMcL © (2005-05-24 10:41) [11]>>Чапаев © (24.05.05 09:52) [10]
Боюсь ошибиться, но, по-моему, там будут байты
=)
← →
Игорь Шевченко © (2005-05-24 10:52) [12]В начале файла 2 байта определяют кодировку. И все.
← →
VMcL © (2005-05-24 10:54) [13]>>Игорь Шевченко © (24.05.05 10:52) [12]
См. [7].
← →
Игорь Шевченко © (2005-05-24 11:26) [14]VMcL © (24.05.05 10:54) [13]
http://www.unicode.org/faq/utf_bom.html
← →
Eraser © (2005-05-24 11:33) [15]КиТаЯц © (24.05.05 08:09)
Я всегда говорил, что тотал командер - #$$$# (цезура).
имхо окошки удобнее. Не зрая виндовоз и никсы (и не только) именно с оконным интерфейсом.
← →
Newbie (2005-05-24 12:24) [16]КиТаЯц © (24.05.05 08:09)
Вариант: повесить в TC на F3 (или Alt-F3) View64 вместо встроенного Lister. Автоматически распознает практически все существующие кодировки и их разновидности, в частности UTF-8.
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2005.06.06;
Скачать: [xml.tar.bz2];
Память: 0.48 MB
Время: 0.022 c