Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.12.26;
Скачать: CL | DM;

Вниз

Конвертация HTML файла   Найти похожие ветки 

 
VAV   (2004-12-10 14:21) [0]

Народ подскажите как мне конвертировать html файл хотя бы в текст.
Задача стоит вытащить из файла нужную табличку и запихать ее в базу.
Какими средствами это можно сделать и как?
Буду благодарен за пример.


 
VAV   (2004-12-10 14:54) [1]

Ну, что неужели никто этого никогда не делал ?...


 
Александр Иванов ©   (2004-12-10 15:14) [2]

Это легко сделать средствами Дельфи и БД.


 
VAV   (2004-12-10 15:19) [3]

А какими именно. Учитывая то что я в html коде профан. Текст простой разгрести смогу.


 
Александр Иванов ©   (2004-12-10 15:27) [4]

Тогда надо почитать про HTML.


 
DiamondShark ©   (2004-12-10 15:46) [5]


> А какими именно. Учитывая то что я в html коде профан. Текст
> простой разгрести смогу.

А HTML и есть "текст простой".
Отсюда первый метод очевиден: "разгрести" HTML как текст и выделить нужную информацию.

Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент.

Описание элементов HTML можно найти, к примеру, здесь:
http://msdn.microsoft.com/library/default.asp?url=/workshop/author/html/reference/elements.asp

Там же рядышком есть и описание объектной модели MSHTML.


 
Jeer ©   (2004-12-10 15:51) [6]

VAV   (10.12.04 15:19) [3]

HTML и есть текст. файл.


 
VAV   (2004-12-14 14:57) [7]

Да я в курсе, что HTML и есть текст, но вот "мусору" в этом тексте хоть отбавляй, а нужно достать одну табличку. Как не крутил я этот текст ненайду за что зацепится, чтобы ненужное отсеить.

> Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент

а где про этот MSHTML по русски почитать можно?


 
able ©   (2004-12-14 15:09) [8]

VAV   (14.12.04 14:57) [7]

> а нужно достать одну табличку

Ищи
<table>
..
</table



Страницы: 1 вся ветка

Текущий архив: 2004.12.26;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.038 c
10-1074607237
morfey-night
2004-01-20 17:00
2004.12.26
динамическое создание TDataModule


3-1101802909
Russko
2004-11-30 11:21
2004.12.26
Проверка на "занятость" базы данных.


14-1102609969
12345
2004-12-09 19:32
2004.12.26
Add-on for Internet Explorer.


3-1101984331
svv
2004-12-02 13:45
2004.12.26
Как сделать чтобы в DBGrid не отображалась смена текущей записи.


3-1101392577
kaktus
2004-11-25 17:22
2004.12.26
Delphi и MySQL