Форум: "Основная";
Текущий архив: 2006.09.10;
Скачать: [xml.tar.bz2];
ВнизФункция удаления тегов из HTML Найти похожие ветки
← →
[wl] © (2006-07-27 11:20) [0]скиньте пожалуйста такую функцию, если у кого-то есть.
← →
[wl] © (2006-07-27 11:29) [1]или компонент, если такой существует.
Если просто удалить от < до >, тогда получится одна длинная строка (или несколько длинных), такой вариант не подходит
← →
TUser © (2006-07-27 18:03) [2]Имхо, проще самому написать. См. про конечные автоматы, тут эта тема тоже много раз была.
← →
wl © (2006-07-28 00:59) [3]да как-то не хотелось изобретать велосипед, обязательно что-то упущу...
ну ладно, раз готового нет...
← →
tButton © (2006-07-28 06:27) [4]есть функция которая режет комменты из HTML (к сожалению закомментированые скрипты тоже =))
могу в принципе приспособить под резку всех тегов
← →
Slym © (2006-07-28 07:17) [5]Загружаешь в MSXML.DOMDocument и по веточкам бежишь выдирая Text
← →
Оран Гутангович (2006-07-28 08:14) [6]Регулярным выражением проще всего. Выглядит это примерно так
function GetRowText(MessageText:String):String; // удаляет теги из текста и лишние пробелы
var buff:String;
begin
buff:=MessageText;
with FExp do
begin
RegEx:="<.*>"; // удаление тегов
Options:=[preUnGreedy];
Subject :=buff;
Replacement := "";
ReplaceAll;
buff:=Subject;
RegEx:="\s{2,}"; // удаление лишних пробелов
Options:=[preUnGreedy];
Subject :=buff;
Replacement := "";
ReplaceAll;
buff:=Subject;
end;
Result:=buff;
end;
← →
@BraIN © (2006-07-28 13:37) [7]Уже много-много раз говорили, что не предназначен regexpr для парсинга html. В FastLib есть функция StripHTMLorNonHTML.
http://www.megalib.com/books/923/63.htm
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2006.09.10;
Скачать: [xml.tar.bz2];
Память: 0.45 MB
Время: 0.037 c