Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.06.25;
Скачать: CL | DM;

Вниз

IHTMLDocument2 извлечение ссылок с кирилличными символами   Найти похожие ветки 

 
VladR   (2005-06-28 13:19) [0]

Для извлечения ссылок из html - страницы я использую IHTMLDocument2 Interface. Записываю текст страницы в документ методом IHTMLDocument2.Write. Пробегая по коллекции элементов, извлекаю все ссылки. Когда ссылка содержит перекодированные кирилличные символы (Например: dmoz.org/World/Russian/%d0%9a%d0%be%d0%bc%d0%bf%d1%8c%d1%8e%d1%82%d0%b5%d1%80%...), то IHTMLDocument как-то по своему ее перекодирует, в результате чего получается что-то такое: dmoz.org/World/Russian/????????N?N?N??µN?N?/?˜??N??µN????µN?/.
Может кто то знает как с этим бороться.


 
doomguy   (2005-07-11 20:25) [1]

Знаем и боремся. Строка с вопросительными знаками в UTF-8, если я тут ошибаюсь ( не работал с IHTMLDocument2, но столкнулся с этим когда писал на Delphi веб-сервер ) , то преобразования из hex вида %20%D0.... выдадут UTF-8, а дальше уже можно пользовать WinAPI, или встроенные в Delphi обертки к этим ф-ям ( UTF8ToAnsi, например ).

Главное терпение и упорство, ну и смекалки немного ;-)



Страницы: 1 вся ветка

Текущий архив: 2006.06.25;
Скачать: CL | DM;

Наверх




Память: 0.46 MB
Время: 0.039 c
15-1149157227
serjkap
2006-06-01 14:20
2006.06.25
карты


2-1149429896
Krants
2006-06-04 18:04
2006.06.25
SQL запросы


4-1143474014
ZeBriD
2006-03-27 19:40
2006.06.25
Перехват содержимого TMemo другой программы


2-1149644505
Никос
2006-06-07 05:41
2006.06.25
Типы


4-1143213561
SkierMax
2006-03-24 18:19
2006.06.25
Список запущенных приложений