Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Сети";
Текущий архив: 2005.10.23;
Скачать: [xml.tar.bz2];

Вниз

как считать таблицу из HTML-страницы?   Найти похожие ветки 

 
just   (2005-07-04 11:32) [0]

см. сабж


 
TUser ©   (2005-07-04 11:35) [1]

Надо написать HTML-парсер, или найти готовый - их навалом.


 
ferr ©   (2005-07-04 11:49) [2]

При каких обстоятельствах? Если файл в WebBrowser"е то одно, если в тексте, то другое.


 
just   (2005-07-04 11:57) [3]

2ferr ©   (04.07.05 11:49) [2]
Обстоятельства такие:
имеются html-странички, пока просто в виде файлов,
затем, возможно, считывание будет из сайта.
Посните разницу, пожалуйста.


 
ferr ©   (2005-07-04 12:08) [4]

Если текст, то см [1].
Если же надо работать со страницей загруженной в WebBrowser, то тут можно обращаться к Com-объектам.

Скорее всего Вам подходит 1.

Если не трудно обрисуйте задачу поподробней. Какая таблица? Считать текст(без тегов)?


 
just   (2005-07-04 12:28) [5]

Задача такая:
надо считать содержимое таблицы и занести ее в БД. таблица имеет фиксированное число столбцов (оно известно), и неограниченное число строк (всегда по-разному). Файлы обновляются каждый месяц. Что еще? В файлах содержится информация другого вида - картинки, текст, и др. - она не нужна. Считывается только таблица.


 
ferr ©   (2005-07-04 13:45) [6]

Прошу прощения за ненужные вопросы. Вам действительно подходит [1].


 
АНТИСПАММЕР ©   (2005-07-05 00:50) [7]

наверное можно и так :
1. Скачиваем страницу через twebbrowser;
2. Через DOM - иерархию добираемя до нужной таблицы.
3. Берем тэг  выдергиваем текст через свойство InnerHTML
4. Берем следующий тэг выдергиваем рисунок
5. п 3-4 повторить по количеству строк


 
just   (2005-07-05 06:57) [8]

Поясни, что за DOM?


 
just   (2005-07-05 11:58) [9]

может кто-нить подскажет какой HTML парсер (компонент Delphi) лучше?


 
dmitry501 ©   (2005-07-05 12:47) [10]

just   (05.07.05 11:58) [9]
http://december.nm.ru/DelphiHTMLParsers.htm


 
АНТИСПАММЕР ©   (2005-07-05 20:36) [11]

document object model



Страницы: 1 вся ветка

Форум: "Сети";
Текущий архив: 2005.10.23;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.47 MB
Время: 0.037 c
11-1109578928
NorthMan
2005-02-28 11:22
2005.10.23
[Error] Unit1_1.inc: Identifier redeclared: NewForm1


14-1128276873
ArtemESC
2005-10-02 22:14
2005.10.23
установить HomeXP поверх ProffessionalXP


14-1127922469
Kerk
2005-09-28 19:47
2005.10.23
Знатокам HTML/CSS


4-1124694289
Fanny
2005-08-22 11:04
2005.10.23
Как обойтись без StrLCat ?


14-1128497676
konda
2005-10-05 11:34
2005.10.23
Глюк в IE6





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский