Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2005.03.20;
Скачать: CL | DM;

Вниз

Как из html строки взять текст без тегов???   Найти похожие ветки 

 
Луарвик   (2005-03-06 01:58) [0]

Пример: строка "<p><strong><font color="#FF0000" face="fuckinfont">Твикаем XP</font></strong></p>"
А нужно получить лишь "Твикаем XP"


 
SergP ©   (2005-03-06 02:11) [1]

Типа так:

while pos("<",s)>0 do
delete(s,pos("<",s),pos(">",s)-pos("<",s)+1);

Смысл думаю понятен, а что касается всяких непредвиденных обстоятельств (типа всяких приколов с тегами) думаю что сам справишься...


 
Луарвик   (2005-03-06 02:23) [2]

Благодарю.
Все таки есть еще на форуме Программеры...


 
GanibalLector ©   (2005-03-06 02:24) [3]

См.темы "Конечные автоматы и регулярные выражения".
В Бакнелле этой теме посвящено порядка 80 страниц.Занятное чтиво ;)


 
vertal ©   (2005-03-06 02:24) [4]

Здесь надо осторожнее. Если заранее известно, что в этом HTML нет скриптов, комментариев, таблиц стилей, в строках- закавыченных значениях атрибутов тегов нет символов "<" и ">" , то можно и через Pos. А если программа должна корректно обрабатывать корректный HTML - код произвольной структуры, то нужно пропускать, то есть не реагировать на эти скобки, внутри этих элементов. Например, вот код, который ищет конец тега

const
 Quotes :Set Of Char = ["""","""];
   ...

             while (Result <> nil) and not (Result^ in [ #0, ">"]) do
             begin
               while not (Result^ in (Quotes + [">",#0])) do Inc(Result);
               if Result^ in Quotes then
                 Result := StrScan(Result + 1, Result^);
               if (Result <> nil) and (Result^ <> ">") then inc(Result);
             end;

При начале выполнения этого фрагмента Result типа PChar указывает на символ, следующий за именем тега. После его выполнения Result указывает на завершающий определение тега символ ">", или Result = nil или Result^ = #0 , если завершение определения тега было не найдено.


 
Луарвик   (2005-03-06 02:28) [5]

Пасибо, но я говорил именно про строки. Короткие, не несущие в себе таблиц и прочих структур...


 
vertal ©   (2005-03-06 02:48) [6]

Кстати, в HTML целый документ спокойно может быть записан в одну строку, на его отображение это не повлияет, некоторые оптимизаторы могут так над ним извращаться. Но дело конечно ваше. И еще - если строка большая, то вместо delete быстрее использовать копирование того, что остается от строки после вырезания тегов, в новый буфер, через StrLCopy или Move.


 
Луарвик   (2005-03-06 13:33) [7]

ОК!



Страницы: 1 вся ветка

Текущий архив: 2005.03.20;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.026 c
14-1109313006
вредитель
2005-02-25 09:30
2005.03.20
МРОС (читать заадомм наа пеередд) не дремлет


14-1109105099
GanibalLector
2005-02-22 23:44
2005.03.20
Give IO или нулевое кольцо ???


11-1093134962
SSSSS
2004-08-22 04:36
2005.03.20
Здравствуйте все! Как сделать ДЛЛ???


1-1110362767
rolex
2005-03-09 13:06
2005.03.20
Зачем нужны DLL???


14-1109429017
TUser
2005-02-26 17:43
2005.03.20
Форум по VBA