Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.12.26;
Скачать: CL | DM;

Вниз

Конвертация HTML файла   Найти похожие ветки 

 
VAV   (2004-12-10 14:21) [0]

Народ подскажите как мне конвертировать html файл хотя бы в текст.
Задача стоит вытащить из файла нужную табличку и запихать ее в базу.
Какими средствами это можно сделать и как?
Буду благодарен за пример.


 
VAV   (2004-12-10 14:54) [1]

Ну, что неужели никто этого никогда не делал ?...


 
Александр Иванов ©   (2004-12-10 15:14) [2]

Это легко сделать средствами Дельфи и БД.


 
VAV   (2004-12-10 15:19) [3]

А какими именно. Учитывая то что я в html коде профан. Текст простой разгрести смогу.


 
Александр Иванов ©   (2004-12-10 15:27) [4]

Тогда надо почитать про HTML.


 
DiamondShark ©   (2004-12-10 15:46) [5]


> А какими именно. Учитывая то что я в html коде профан. Текст
> простой разгрести смогу.

А HTML и есть "текст простой".
Отсюда первый метод очевиден: "разгрести" HTML как текст и выделить нужную информацию.

Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент.

Описание элементов HTML можно найти, к примеру, здесь:
http://msdn.microsoft.com/library/default.asp?url=/workshop/author/html/reference/elements.asp

Там же рядышком есть и описание объектной модели MSHTML.


 
Jeer ©   (2004-12-10 15:51) [6]

VAV   (10.12.04 15:19) [3]

HTML и есть текст. файл.


 
VAV   (2004-12-14 14:57) [7]

Да я в курсе, что HTML и есть текст, но вот "мусору" в этом тексте хоть отбавляй, а нужно достать одну табличку. Как не крутил я этот текст ненайду за что зацепится, чтобы ненужное отсеить.

> Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент

а где про этот MSHTML по русски почитать можно?


 
able ©   (2004-12-14 15:09) [8]

VAV   (14.12.04 14:57) [7]

> а нужно достать одну табличку

Ищи
<table>
..
</table



Страницы: 1 вся ветка

Текущий архив: 2004.12.26;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.023 c
14-1102416695
vajo
2004-12-07 13:51
2004.12.26
12 декабря - Праздник? Т.Е. 13 декабря - Выходной?


4-1100260115
Sergio
2004-11-12 14:48
2004.12.26
Перехват нажатие клавиш с Word-а


6-1097394014
RaPToR_1
2004-10-10 11:40
2004.12.26
recv


3-1101378468
sk
2004-11-25 13:27
2004.12.26
Обновление записи


1-1102704211
LeoXXX
2004-12-10 21:43
2004.12.26
Components