Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.10.31;
Скачать: CL | DM;

Вниз

Хитрый парсинг   Найти похожие ветки 

 
Checist [root]   (2004-10-18 12:10) [0]

И так. Имеем в WebBrowser загруженный html док, в котором 3-и картинки (jpg), с каждой картинки ссылки на разные ресурсы (jpg, mp3, exe). Необходимо произвести парсинг и в итоге получить, например: www.get.ru/1.jpg - www.soft.ru, www.get.ru/2.jpg - www.music.ru/muz.mp3, www.get.ru/3.jpg - www.photo.com/pict/1.bmp. Получить отдельно все адресса картинок и ссылки с них я могу, а как получить: адресс картинки - ссылку с нее. Дайте кусок сыра. Очень прошу.


 
KSergey ©   (2004-10-18 12:14) [1]

> Получить отдельно все адресса картинок и ссылки с них я
> могу, а как получить: адресс картинки - ссылку с нее.

Не понял... А это что?


 
KilkennyCat ©   (2004-10-18 12:15) [2]

дак елементарно:
предположим, в s1 - адрес картинки, а в s2 - адрес ссылки.
в итоге result := s1 + " - " + s2;


 
begin...end ©   (2004-10-18 12:17) [3]


> [1] KSergey ©   (18.10.04 12:14)

Картинка тоже может быть ссылкой.


 
Checist [root]   (2004-10-18 12:22) [4]

Если предположим с 1-ой картинки нет ссылки то получим несоответствие. То кесть иммем: 1 картинка - пусто, 2 - 1 ссылка, 3 - 2 сылка. А получим: 1 - 1 ссылка, 2 - 2, 3 - пусто. Так то!!!


 
KSergey ©   (2004-10-18 12:35) [5]

Аааа, вот про какие ссылки речь..
Ну а проблема-то в чем?
Только не понятно как вариант

> 3 - пусто

должен быть обыгран? Его не должно быть в списке? Или должно быть что-то - но что?

Если первое -

// sAHerf - строка со ссылкой
if sAHref <> EmptyStr then
  // выводим получившуюся пару как в [2]


 
Checist [root]   (2004-10-18 12:52) [6]

В этом и дело, как вытащить через WebBrowser.document... строки содержищие одновременно и картинку и ссылку с нее. Вообще как вытащить не весть документ, а отдельную строку...


 
easy ©   (2004-10-18 14:16) [7]

unit Unit1;

interface

uses
 Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
 Dialogs, StdCtrls, OleCtrls, SHDocVw;

type
 TForm1 = class(TForm)
   WebBrowser1: TWebBrowser;
   Memo1: TMemo;
   procedure FormCreate(Sender: TObject);
   procedure WebBrowser1DocumentComplete(Sender: TObject;
     const pDisp: IDispatch; var URL: OleVariant);
 private
   { Private declarations }
 public
   { Public declarations }
 end;

var
 Form1: TForm1;

implementation

{$R *.dfm}

procedure TForm1.FormCreate(Sender: TObject);
begin
 with Memo1 do begin
   Clear;
   ScrollBars:=ssBoth;
   Align:=alBottom;
   Height:=300;
 end;
 with WebBrowser1 do begin
   Align:=alClient;
   Navigate("http://delphimaster.net/view/1-1098087032/");
 end;
end;

procedure TForm1.WebBrowser1DocumentComplete(Sender: TObject;
 const pDisp: IDispatch; var URL: OleVariant);
var
 Images:OleVariant;
 i:integer;
 href:string;
begin
 Images:=WebBrowser1.OleObject.document.all.tags("IMG");
 for i:=0 to Images.length-1 do begin
   if Images.item(i).parentElement.tagName="A" then
     href:=Images.item(i).parentElement.href else
     href:="Empty";
     Memo1.Lines.Add("IMG"+inttostr(i)+": src: ["+Images.item(i).src+"], href: ["+href+"]");
 end;
end;

end.


 
Checist [root]   (2004-10-18 16:04) [8]

Большое тебе человеческое спасибо easy!



Страницы: 1 вся ветка

Текущий архив: 2004.10.31;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.034 c
6-1093319278
SlyFox
2004-08-24 07:47
2004.10.31
NMPOP3: Cannot create file


6-1093085403
fax
2004-08-21 14:50
2004.10.31
Подключение к сайту и ввод нужных данных....


3-1096217761
Zif
2004-09-26 20:56
2004.10.31
Как связать 2 таблицы...


8-1091206935
NOX
2004-07-30 21:02
2004.10.31
ищу DXGUtils.pas


3-1096530936
aleks-ran
2004-09-30 11:55
2004.10.31
Транзакция и INSERT? D6, Paradox





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский