Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.12.19;
Скачать: CL | DM;

Вниз

Семиричная кодировка в текстовом файле   Найти похожие ветки 

 
Lola ©   (2004-10-01 17:35) [0]

Есть текстовый файл (экспорт письма). Иногда почтовые сервера кириллицу перекодируют в семиричную кодировку (KOI или WIN). Мне надо прочитать эти строки в TMemo. Но... штатными средствами получаю пустую строку. Более того, после такой строки, следующие тоже читаются как пустые.
Нашла таблицы перекодировки, но если я получаю пустую строку на входе функции, то ничего и неперекодируется, ессестно...
Что делать?


 
Reindeer Moss Eater ©   (2004-10-01 17:38) [1]

Если письмо было на русском и не в KOI и почтовый сервер откусил старший бит в каждом байте, то письмо можно выкинуть.
Если же оно было в KOI, то письмо превратится в транслит.


 
Lola ©   (2004-10-01 17:43) [2]


> Reindeer Moss Eater ©   (01.10.04 17:38) [1]

Аутлук и бат эти письма читают нормально. Мне нужен сабжект получить из письма.
Например: в письме строка "Subject: =?koi8-r?Q?=EE=C1=D0=CF=CD=C9=CE=C1=CE=C9=C5?=". У меня же в программе прочитывается только "Subject".
То же самое с  windows-1251.


 
Erik1 ©   (2004-10-01 17:46) [3]

А чем читаем? Приведи сначала код чтения, а после уж можно о перекодировки думать. Когда будет, что перекодировать.


 
Reindeer Moss Eater ©   (2004-10-01 17:47) [4]

Все зависит от того, что мы понимаем под перекодировкой в семибитный формат.
В америке например программистам невдомек зачем символы кодировать восемью битами когда для их алфавита достаточно семи.
Поэтому есть сервера, котрые откусывают старший бит у каждого байта в теле письма.
Я имел ввиду это.
Если письмо было написано по русски в KOI-8r то оно останется после этого читабельным но в транслите.
У вас же  скорее всего  все намного проще.
Надо перекодировать строки из b64.
Вот и все.


 
Reindeer Moss Eater ©   (2004-10-01 17:49) [5]

А эта тема письма в кои-8 но потом еще в quoted printable.


 
TUser ©   (2004-10-01 18:22) [6]

Я не знаю, но вопрос: имеющиеся библиотеки (Indy, ICS) решают проблему?


 
Anatoly Podgoretsky ©   (2004-10-01 19:29) [7]

Reindeer Moss Eater ©   (01.10.04 17:47) [4]
Это для экономии, нулевые биты легче проходят по сети, они круглые, скользкие.

Lola ©   (01.10.04 17:43) [2]
Как сказал Reindeer Moss Eater ©   (01.10.04 17:49) [5] это транспортная упаковка, смотри в сетевых компонентах, например в ИНДИ, что есть для превращения из упакованого формата в КОИ-8, а затем уже любым перекодировщиком перекодируешь в 1251


 
Reindeer Moss Eater ©   (2004-10-01 21:37) [8]

Кстати, тема письма в посте №2 - "Напоминание"


 
Lola ©   (2004-10-01 22:34) [9]

Спасибо, посмотрю ИНДИ. Если что, то свистну.

> Anatoly Podgoretsky ©   (01.10.04 19:29) [7]

Насчет округлости нулевых битов, кстати, дельное наблюдение ;)


 
Lola ©   (2004-10-05 14:25) [10]

Свищу...
С обрезанием первых битов разобралась, все - окей.
Но попадаются письма со строками типа: "8yDu4fP09fDh4P3p7SE" - В переводе: "С НОВЫМ ГОДОМ!" В заголовке стоит koi8-r, но это что-то другое, или оно, но трансформированное. Подскажите, что это за кодировка?


 
atruhin ©   (2004-10-05 17:46) [11]

Прочитай - "Интернет решения от доктора Боба"  был файл drbobinetrus.doc - там много о кодировках.


 
Lola ©   (2004-10-05 20:32) [12]


> atruhin ©   (05.10.04 17:46) [11]

Много о кодировках (очень много) я уже прочитала. В глазах рябит. Везде одно и тоже. Но Ваше тоже посмотрю (найду и посмотрю).
Но, всетаки, спецы сразу узнают, про что это?


 
Lola ©   (2004-10-06 14:46) [13]

Уточняю, строка:
Subject: =?koi8-r?B?=8yDu4fP09fDh4P3p7SE=?=
означает:
Subject: С НАСТУПАЮЩИМ!

Что-то видимо значит "?B?". Потому что в обыкновенных "откусанных" строках стоит "?Q?", видимо означающий quoted...

И Инди эту строку не берет...


 
Lola ©   (2004-10-06 22:03) [14]

Всё, отбой воздушной тревоги :))
Как это не смешно, но это BASE64 в KOI-8.



Страницы: 1 вся ветка

Текущий архив: 2004.12.19;
Скачать: CL | DM;

Наверх




Память: 0.5 MB
Время: 0.037 c
1-1102435699
yanker
2004-12-07 19:08
2004.12.19
Сохранение экземляра класса в файл


3-1100778681
ds
2004-11-18 14:51
2004.12.19
Отображение в DBGrid


1-1102318940
Виктор
2004-12-06 10:42
2004.12.19
Правильное унаследование свойств классов.


4-1099669422
Meff
2004-11-05 18:43
2004.12.19
CreateWindow


1-1102061985
AlexanderVas
2004-12-03 11:19
2004.12.19
Связать название объекта с самим объектом