Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2004.01.13;
Скачать: [xml.tar.bz2];

Вниз

Как правильно проводить лексический анализ текста ? Разбиение   Найти похожие ветки 

 
Кен   (2003-12-25 02:34) [0]

его на теги. В виде чего лучше ( удобнее ) полученные теги хранить ? Один общий массив. Один тип тегов - один массив. Или вместо массива использовать дерево ? Есть ли специальные наборы функций под Дельфи для разбора текста на теги и последующей работы с ним ? Что можно в Интернете почитать по этому вопросу, дабы не изобретать велосипеда ?


 
TUser   (2003-12-25 13:41) [1]

Если у ебя теги, то мне кажется, лучше хранить в виде дерева вложенных объектов типа, допустим TTag. У такого объекта должен быть свойств, где описан тип тега и свойства для свех его других параметров. А кроме того - массив объектов TTag, где ты хранишь вложенные теги.


 
Teetotaller   (2003-12-25 14:55) [2]

У www.torry.net есть компонент jvEasyXML - он парсит xml-файл и создает дерево.
Если это и не то, что тебе нужно, иерархию классов вполне можно содрать.


 
Кен   (2003-12-26 01:16) [3]


> TUser © (25.12.03 13:41) [1]
> Если у ебя теги, то мне кажется, лучше хранить в виде дерева
> вложенных объектов типа, допустим TTag. У такого объекта
> должен быть свойств, где описан тип тега и свойства для
> свех его других параметров. А кроме того - массив объектов
> TTag, где ты хранишь вложенные теги.

Так вложений же много. Хтмл-страничка например, где таблица в таблице. Там уровней десять может быть вложений.


> Teetotaller (25.12.03 14:55) [2]
> У www.torry.net есть компонент jvEasyXML

Что то не находится.
Я ещё хотел теорию почитать. Как вообще это грамотно делать.


 
TUser   (2003-12-26 09:03) [4]

1. Ну и пусть их будет сколько угодно. Примерно так организованы всякие TTreeNode и пр. - у них есть массив таких же элементов более низкого уровня. И уровней - хоть сколько можно делать.

2. jvЧто-Нибудь - это из пакета JEDI. Он есть здесь
http://jvcl.sourceforge.net


 
TUser   (2003-12-26 09:04) [5]

Кстати, если у тебя HTML страничка - то в jedi готовый парсер для html&xml есть.


 
Анонимщик   (2003-12-26 12:01) [6]

Ну, смотри, напрмер,
http://www.eltech.ru/misc/edu/Index.htm
И прочую литературу по тому же поводу. Я бы и больше ссылок дал, но дело не очень простое и быстрое.


 
TUser   (2003-12-26 13:01) [7]

Вот здесь есть про лексичекий анализ
http://www.ergeal.ru/archive/cs/cc.htm



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2004.01.13;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.007 c
3-37511
пустойчайник
2003-12-16 12:25
2004.01.13
Странное поведение программы (DBGrid)


1-37794
succer
2003-12-28 04:53
2004.01.13
Как переустановить модуль forms.pas


14-37877
Кукушкинд
2003-12-22 14:51
2004.01.13
Как вы относитесь к отечественному кинематографу?


14-37875
race1
2003-12-22 15:18
2004.01.13
чайники


7-37970
Glow-20
2003-10-31 12:36
2004.01.13
Модем2mp3.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский