Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2004.12.26;
Скачать: [xml.tar.bz2];

Вниз

Конвертация HTML файла   Найти похожие ветки 

 
VAV   (2004-12-10 14:21) [0]

Народ подскажите как мне конвертировать html файл хотя бы в текст.
Задача стоит вытащить из файла нужную табличку и запихать ее в базу.
Какими средствами это можно сделать и как?
Буду благодарен за пример.


 
VAV   (2004-12-10 14:54) [1]

Ну, что неужели никто этого никогда не делал ?...


 
Александр Иванов ©   (2004-12-10 15:14) [2]

Это легко сделать средствами Дельфи и БД.


 
VAV   (2004-12-10 15:19) [3]

А какими именно. Учитывая то что я в html коде профан. Текст простой разгрести смогу.


 
Александр Иванов ©   (2004-12-10 15:27) [4]

Тогда надо почитать про HTML.


 
DiamondShark ©   (2004-12-10 15:46) [5]


> А какими именно. Учитывая то что я в html коде профан. Текст
> простой разгрести смогу.

А HTML и есть "текст простой".
Отсюда первый метод очевиден: "разгрести" HTML как текст и выделить нужную информацию.

Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент.

Описание элементов HTML можно найти, к примеру, здесь:
http://msdn.microsoft.com/library/default.asp?url=/workshop/author/html/reference/elements.asp

Там же рядышком есть и описание объектной модели MSHTML.


 
Jeer ©   (2004-12-10 15:51) [6]

VAV   (10.12.04 15:19) [3]

HTML и есть текст. файл.


 
VAV   (2004-12-14 14:57) [7]

Да я в курсе, что HTML и есть текст, но вот "мусору" в этом тексте хоть отбавляй, а нужно достать одну табличку. Как не крутил я этот текст ненайду за что зацепится, чтобы ненужное отсеить.

> Вариант второй -- использовать готовый парсер HTML и его объектную модель. Можно использовать MSHTML, он точно есть на любой машине, доступен как COM компонент

а где про этот MSHTML по русски почитать можно?


 
able ©   (2004-12-14 15:09) [8]

VAV   (14.12.04 14:57) [7]

> а нужно достать одну табличку

Ищи
<table>
..
</table



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2004.12.26;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.151 c
3-1101896654
СержК
2004-12-01 13:24
2004.12.26
Не получается сделать выборку


1-1102412447
denis24
2004-12-07 12:40
2004.12.26
форма-заставка


14-1102493047
Cosinus
2004-12-08 11:04
2004.12.26
Господа сис.админы и пользователи NT-шек. Проблеммы с юникод.


1-1102596883
Aleksandr.
2004-12-09 15:54
2004.12.26
Люди, ничего уже не понимаю! В чем провинилась ExtractFileName?


1-1102501731
Sirus
2004-12-08 13:28
2004.12.26
Как вставить байты в файл и как их оттуда удалить???





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский