Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.12.26;
Скачать: CL | DM;

Вниз

Конвертация HTML файла   Найти похожие ветки 

 
VAV   (2004-12-10 14:21) [0]

Народ подскажите как мне конвертировать html файл хотя бы в текст.
Задача стоит вытащить из файла нужную табличку и запихать ее в базу.
Какими средствами это можно сделать и как?
Буду благодарен за пример.


 
VAV   (2004-12-10 14:54) [1]

Ну, что неужели никто этого никогда не делал ?...


 
Александр Иванов ©   (2004-12-10 15:14) [2]

Это легко сделать средствами Дельфи и БД.


 
VAV   (2004-12-10 15:19) [3]

А какими именно. Учитывая то что я в html коде профан. Текст простой разгрести смогу.


 
Александр Иванов ©   (2004-12-10 15:27) [4]

Тогда надо почитать про HTML.


 
DiamondShark ©   (2004-12-10 15:46) [5]


> А какими именно. Учитывая то что я в html коде профан. Текст
> простой разгрести смогу.

А HTML и есть "текст простой".
Отсюда первый метод очевиден: "разгрести" HTML как текст и выделить нужную информацию.

Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент.

Описание элементов HTML можно найти, к примеру, здесь:
http://msdn.microsoft.com/library/default.asp?url=/workshop/author/html/reference/elements.asp

Там же рядышком есть и описание объектной модели MSHTML.


 
Jeer ©   (2004-12-10 15:51) [6]

VAV   (10.12.04 15:19) [3]

HTML и есть текст. файл.


 
VAV   (2004-12-14 14:57) [7]

Да я в курсе, что HTML и есть текст, но вот "мусору" в этом тексте хоть отбавляй, а нужно достать одну табличку. Как не крутил я этот текст ненайду за что зацепится, чтобы ненужное отсеить.

> Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент

а где про этот MSHTML по русски почитать можно?


 
able ©   (2004-12-14 15:09) [8]

VAV   (14.12.04 14:57) [7]

> а нужно достать одну табличку

Ищи
<table>
..
</table



Страницы: 1 вся ветка

Текущий архив: 2004.12.26;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.028 c
1-1102695692
Dema-X
2004-12-10 19:21
2004.12.26
из dynamic Child зделать nill


14-1102159316
Труп Васи Доброго
2004-12-04 14:21
2004.12.26
Клиент форума "Magic Forum" 1.2


1-1102505567
Игорь нтк
2004-12-08 14:32
2004.12.26
отображение ячейки


4-1100368383
axx
2004-11-13 20:53
2004.12.26
Помогите с SendMessage


9-1093594586
RagE
2004-08-27 12:16
2004.12.26
Курсор и OpenGL