Форум: "Основная";
Текущий архив: 2004.12.26;
Скачать: [xml.tar.bz2];
ВнизКонвертация HTML файла Найти похожие ветки
← →
VAV (2004-12-10 14:21) [0]Народ подскажите как мне конвертировать html файл хотя бы в текст.
Задача стоит вытащить из файла нужную табличку и запихать ее в базу.
Какими средствами это можно сделать и как?
Буду благодарен за пример.
← →
VAV (2004-12-10 14:54) [1]Ну, что неужели никто этого никогда не делал ?...
← →
Александр Иванов © (2004-12-10 15:14) [2]Это легко сделать средствами Дельфи и БД.
← →
VAV (2004-12-10 15:19) [3]А какими именно. Учитывая то что я в html коде профан. Текст простой разгрести смогу.
← →
Александр Иванов © (2004-12-10 15:27) [4]Тогда надо почитать про HTML.
← →
DiamondShark © (2004-12-10 15:46) [5]
> А какими именно. Учитывая то что я в html коде профан. Текст
> простой разгрести смогу.
А HTML и есть "текст простой".
Отсюда первый метод очевиден: "разгрести" HTML как текст и выделить нужную информацию.
Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент.
Описание элементов HTML можно найти, к примеру, здесь:
http://msdn.microsoft.com/library/default.asp?url=/workshop/author/html/reference/elements.asp
Там же рядышком есть и описание объектной модели MSHTML.
← →
Jeer © (2004-12-10 15:51) [6]VAV (10.12.04 15:19) [3]
HTML и есть текст. файл.
← →
VAV (2004-12-14 14:57) [7]Да я в курсе, что HTML и есть текст, но вот "мусору" в этом тексте хоть отбавляй, а нужно достать одну табличку. Как не крутил я этот текст ненайду за что зацепится, чтобы ненужное отсеить.
> Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент
а где про этот MSHTML по русски почитать можно?
← →
able © (2004-12-14 15:09) [8]VAV (14.12.04 14:57) [7]
> а нужно достать одну табличку
Ищи
<table>
..
</table
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2004.12.26;
Скачать: [xml.tar.bz2];
Память: 0.46 MB
Время: 0.057 c