Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.12.26;
Скачать: CL | DM;

Вниз

Конвертация HTML файла   Найти похожие ветки 

 
VAV   (2004-12-10 14:21) [0]

Народ подскажите как мне конвертировать html файл хотя бы в текст.
Задача стоит вытащить из файла нужную табличку и запихать ее в базу.
Какими средствами это можно сделать и как?
Буду благодарен за пример.


 
VAV   (2004-12-10 14:54) [1]

Ну, что неужели никто этого никогда не делал ?...


 
Александр Иванов ©   (2004-12-10 15:14) [2]

Это легко сделать средствами Дельфи и БД.


 
VAV   (2004-12-10 15:19) [3]

А какими именно. Учитывая то что я в html коде профан. Текст простой разгрести смогу.


 
Александр Иванов ©   (2004-12-10 15:27) [4]

Тогда надо почитать про HTML.


 
DiamondShark ©   (2004-12-10 15:46) [5]


> А какими именно. Учитывая то что я в html коде профан. Текст
> простой разгрести смогу.

А HTML и есть "текст простой".
Отсюда первый метод очевиден: "разгрести" HTML как текст и выделить нужную информацию.

Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент.

Описание элементов HTML можно найти, к примеру, здесь:
http://msdn.microsoft.com/library/default.asp?url=/workshop/author/html/reference/elements.asp

Там же рядышком есть и описание объектной модели MSHTML.


 
Jeer ©   (2004-12-10 15:51) [6]

VAV   (10.12.04 15:19) [3]

HTML и есть текст. файл.


 
VAV   (2004-12-14 14:57) [7]

Да я в курсе, что HTML и есть текст, но вот "мусору" в этом тексте хоть отбавляй, а нужно достать одну табличку. Как не крутил я этот текст ненайду за что зацепится, чтобы ненужное отсеить.

> Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент

а где про этот MSHTML по русски почитать можно?


 
able ©   (2004-12-14 15:09) [8]

VAV   (14.12.04 14:57) [7]

> а нужно достать одну табличку

Ищи
<table>
..
</table



Страницы: 1 вся ветка

Текущий архив: 2004.12.26;
Скачать: CL | DM;

Наверх




Память: 0.46 MB
Время: 0.036 c
3-1101896654
СержК
2004-12-01 13:24
2004.12.26
Не получается сделать выборку


1-1102587491
Aleks
2004-12-09 13:18
2004.12.26
как передать фокус и узнать код символа


14-1102339335
Flying Home
2004-12-06 16:22
2004.12.26
Что-то непонятное для меня в исходниках Indy


1-1102981494
Bobby Digital
2004-12-14 02:44
2004.12.26
Canvas


3-1101366224
DuchmanSoft
2004-11-25 10:03
2004.12.26
Групировка в DBChart





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский