Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Сети";
Текущий архив: 2004.12.19;
Скачать: [xml.tar.bz2];

Вниз

Семиричная кодировка в текстовом файле   Найти похожие ветки 

 
Lola ©   (2004-10-01 17:35) [0]

Есть текстовый файл (экспорт письма). Иногда почтовые сервера кириллицу перекодируют в семиричную кодировку (KOI или WIN). Мне надо прочитать эти строки в TMemo. Но... штатными средствами получаю пустую строку. Более того, после такой строки, следующие тоже читаются как пустые.
Нашла таблицы перекодировки, но если я получаю пустую строку на входе функции, то ничего и неперекодируется, ессестно...
Что делать?


 
Reindeer Moss Eater ©   (2004-10-01 17:38) [1]

Если письмо было на русском и не в KOI и почтовый сервер откусил старший бит в каждом байте, то письмо можно выкинуть.
Если же оно было в KOI, то письмо превратится в транслит.


 
Lola ©   (2004-10-01 17:43) [2]


> Reindeer Moss Eater ©   (01.10.04 17:38) [1]

Аутлук и бат эти письма читают нормально. Мне нужен сабжект получить из письма.
Например: в письме строка "Subject: =?koi8-r?Q?=EE=C1=D0=CF=CD=C9=CE=C1=CE=C9=C5?=". У меня же в программе прочитывается только "Subject".
То же самое с  windows-1251.


 
Erik1 ©   (2004-10-01 17:46) [3]

А чем читаем? Приведи сначала код чтения, а после уж можно о перекодировки думать. Когда будет, что перекодировать.


 
Reindeer Moss Eater ©   (2004-10-01 17:47) [4]

Все зависит от того, что мы понимаем под перекодировкой в семибитный формат.
В америке например программистам невдомек зачем символы кодировать восемью битами когда для их алфавита достаточно семи.
Поэтому есть сервера, котрые откусывают старший бит у каждого байта в теле письма.
Я имел ввиду это.
Если письмо было написано по русски в KOI-8r то оно останется после этого читабельным но в транслите.
У вас же  скорее всего  все намного проще.
Надо перекодировать строки из b64.
Вот и все.


 
Reindeer Moss Eater ©   (2004-10-01 17:49) [5]

А эта тема письма в кои-8 но потом еще в quoted printable.


 
TUser ©   (2004-10-01 18:22) [6]

Я не знаю, но вопрос: имеющиеся библиотеки (Indy, ICS) решают проблему?


 
Anatoly Podgoretsky ©   (2004-10-01 19:29) [7]

Reindeer Moss Eater ©   (01.10.04 17:47) [4]
Это для экономии, нулевые биты легче проходят по сети, они круглые, скользкие.

Lola ©   (01.10.04 17:43) [2]
Как сказал Reindeer Moss Eater ©   (01.10.04 17:49) [5] это транспортная упаковка, смотри в сетевых компонентах, например в ИНДИ, что есть для превращения из упакованого формата в КОИ-8, а затем уже любым перекодировщиком перекодируешь в 1251


 
Reindeer Moss Eater ©   (2004-10-01 21:37) [8]

Кстати, тема письма в посте №2 - "Напоминание"


 
Lola ©   (2004-10-01 22:34) [9]

Спасибо, посмотрю ИНДИ. Если что, то свистну.

> Anatoly Podgoretsky ©   (01.10.04 19:29) [7]

Насчет округлости нулевых битов, кстати, дельное наблюдение ;)


 
Lola ©   (2004-10-05 14:25) [10]

Свищу...
С обрезанием первых битов разобралась, все - окей.
Но попадаются письма со строками типа: "8yDu4fP09fDh4P3p7SE" - В переводе: "С НОВЫМ ГОДОМ!" В заголовке стоит koi8-r, но это что-то другое, или оно, но трансформированное. Подскажите, что это за кодировка?


 
atruhin ©   (2004-10-05 17:46) [11]

Прочитай - "Интернет решения от доктора Боба"  был файл drbobinetrus.doc - там много о кодировках.


 
Lola ©   (2004-10-05 20:32) [12]


> atruhin ©   (05.10.04 17:46) [11]

Много о кодировках (очень много) я уже прочитала. В глазах рябит. Везде одно и тоже. Но Ваше тоже посмотрю (найду и посмотрю).
Но, всетаки, спецы сразу узнают, про что это?


 
Lola ©   (2004-10-06 14:46) [13]

Уточняю, строка:
Subject: =?koi8-r?B?=8yDu4fP09fDh4P3p7SE=?=
означает:
Subject: С НАСТУПАЮЩИМ!

Что-то видимо значит "?B?". Потому что в обыкновенных "откусанных" строках стоит "?Q?", видимо означающий quoted...

И Инди эту строку не берет...


 
Lola ©   (2004-10-06 22:03) [14]

Всё, отбой воздушной тревоги :))
Как это не смешно, но это BASE64 в KOI-8.



Страницы: 1 вся ветка

Форум: "Сети";
Текущий архив: 2004.12.19;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.48 MB
Время: 0.037 c
3-1100872553
Dionnis
2004-11-19 16:55
2004.12.19
Поиск по базе ...


14-1101550334
syte_ser78
2004-11-27 13:12
2004.12.19
Оцените бетаверсию программы "Колекционера CD"


3-1101085149
serko
2004-11-22 03:59
2004.12.19
Установка Ehlib!


14-1101384711
Gektor
2004-11-25 15:11
2004.12.19
Посмотреть байт на осциллографе


14-1101557346
gn
2004-11-27 15:09
2004.12.19
Китайское правительство ограничит использование заграничного ПО





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский