Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2005.06.06;
Скачать: [xml.tar.bz2];

Вниз

notepad (Блокнот ) и Utf8   Найти похожие ветки 

 
КиТаЯц ©   (2005-05-24 08:09) [0]

Значит так...
Экспортировал данные в TXT. Данные должны быть в UTF8. Все нормально. Добавил заголовок, типа "здесь данные для того-то и того-то". Открываю текстовик в блокноте - все ОК. Текст читабельно-правительный.

Открываю в TotalCommandere через F3. Текст - кракозябры. Надо нажать последовательно на "A" (ANSI) и потом на "7" (utf-8).
Нормально думаю... Надо в заголовок несколько строк добавить не в не в UTF-8 чтобы юзер мог сразу прочитать что здесь находится.

Добавил. Открываем в листере тоталкоммандера: комментарий - ОК, данные (UTF-8) - кракозябры. Все как и задумывалось.
Но... Теперь при открытии в блокноте происходит тоже самое! И текст в UTF-8 править нельзя!

Вопрос: как notepad определяет кодировку текста? По каким-то ключевым символам? Как сделать, чтобы полюбому txt открывался в блокноте как UTF-8? Что надо в этот TXT-шник вписать? Куда?

Спасибо.


 
ЮЮ ©   (2005-05-24 08:23) [1]

>Надо в заголовок несколько строк добавить не в не в UTF-8 чтобы юзер мог сразу прочитать что здесь находится.

Текстовый файл не иожет содержать текст в нескольких кодировках.


 
VMcL ©   (2005-05-24 08:24) [2]

http://www.unicode.org/

?


 
КиТаЯц ©   (2005-05-24 08:28) [3]

> ЮЮ © (24.05.05 08:23) [1]
Серьезно?
Жаль я не знал...
Знал бы не тратил время когда писал в *.diz файлах комментарии на win1251 + cpp866 чтобы юзер мог и из под винды и из под dos понять что там написано.


 
КиТаЯц ©   (2005-05-24 08:41) [4]

> VMcL ©   (24.05.05 08:24) [2]
Спасибо. Не то немного.
Перефразирую вопрос:
"Как программа notepad (блокнот) определяет кодировку открываемого *.txt файла? По каким ключевым символам в каком месте?"


 
VMcL ©   (2005-05-24 08:44) [5]

>>КиТаЯц ©   (24.05.05 08:41) [4]

>Как программа notepad (блокнот) определяет кодировку открываемого *.txt файла? По каким ключевым символам в каком месте?"

Правда известна только Гейтсу с Ко и дизассемблеру, но подозреваю, что по нескольким первым символам.


 
alex-drob   (2005-05-24 08:54) [6]

Скорее всего по первым символам. Если сохранить в блокноте текст в utf-8, а потом открыть word`ом в кодировке кирилица windows то эти символы видны.


 
VMcL ©   (2005-05-24 08:59) [7]

>>alex-drob   (24.05.05 08:54) [6]

Если Вы имеете в виду EF BB BF, то Notepad и без них определяет UTF-8.


 
КиТаЯц ©   (2005-05-24 09:01) [8]

>VMcL ©   (24.05.05 08:44) [5]
>alex-drob   (24.05.05 08:54) [6]

:) Вот и я так же подозревал. Нихт. Lister TotalCommandera точно по первым символам...

Похоже он ищет во всем тексте сначала симовлы ANSI, а потом уже (если не нашел) Юникод, Юникод Big Еndian и UTF-8. Скорее всего именно в этом порядке... Не утверждаю. Версия.


 
alex-drob   (2005-05-24 09:08) [9]

После выполнения этого кода:

assignfile(f,"d:\1.txt");
rewrite(f);
s:="п»їqwer";
write(f,s);
closefile(f);


В файл сохранится "qwer" в кодеровке UTF-8.
А после этого:
assignfile(f,"d:\1.txt");
rewrite(f);
s:="qwer";
write(f,s);
closefile(f);

В ANSI


 
Чапаев ©   (2005-05-24 09:52) [10]

Сохрани ПУСТОЙ файл в различных кодировках и посмотри, что в него записано. ;-)


 
VMcL ©   (2005-05-24 10:41) [11]

>>Чапаев ©   (24.05.05 09:52) [10]

Боюсь ошибиться, но, по-моему, там будут байты
=)


 
Игорь Шевченко ©   (2005-05-24 10:52) [12]

В начале файла 2 байта определяют кодировку. И все.


 
VMcL ©   (2005-05-24 10:54) [13]

>>Игорь Шевченко ©   (24.05.05 10:52) [12]

См. [7].


 
Игорь Шевченко ©   (2005-05-24 11:26) [14]

VMcL ©   (24.05.05 10:54) [13]

http://www.unicode.org/faq/utf_bom.html


 
Eraser ©   (2005-05-24 11:33) [15]

КиТаЯц ©   (24.05.05 08:09)

Я всегда говорил, что тотал командер - #$$$# (цезура).
имхо окошки удобнее. Не зрая виндовоз и никсы (и не только) именно с оконным интерфейсом.


 
Newbie   (2005-05-24 12:24) [16]

КиТаЯц ©   (24.05.05 08:09)
Вариант: повесить в TC на F3 (или Alt-F3) View64 вместо встроенного Lister. Автоматически распознает практически все существующие кодировки и их разновидности, в частности UTF-8.



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2005.06.06;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.48 MB
Время: 0.022 c
1-1116589938
juice
2005-05-20 15:52
2005.06.06
Как реализовать закрытие многопоточного приложения ?


4-1113511197
elf_123
2005-04-15 00:39
2005.06.06
Dll howto


1-1115493894
Slawutich
2005-05-07 23:24
2005.06.06
Подскажите как програмно узнать день, месяц, год


1-1116506572
Cat
2005-05-19 16:42
2005.06.06
строку по одной цифре раскидать в массив Integer


1-1116487474
dp200
2005-05-19 11:24
2005.06.06
Как програмно открыть файл в конкретном приложении





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский