Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2002.12.05;
Скачать: CL | DM;

Вниз

Посоветуйте, пожалуйста, как лучше отсортировать текстовый файл.   Найти похожие ветки 

 
FLAW ©   (2002-11-24 00:15) [0]

У меня есть большой ТХТ-файл (рус.) в каждой строке которого записано одно слово. Посоветуйте, пожалуйста, как лучше:
1) Удалить повторяющиеся слова.
2) Удалить пустые строки.
3) Расположить слова по алфавиту, причем при добавлении нового должна осуществляться проверка на повтор и новое слово так же должно расположиться в файле по алфавиту.
Прошу подробней, я же "чайник".
Заранее благодарю.


 
Оливейра ©   (2002-11-24 01:57) [1]

Если эту задачу надо выполнять кажный день или чаще:
1) Качаешь Perl с ActiveState
2)
# sort.pl
use POSIX;
use locale;

setlocale("чего-то-там-Ru_ru"); #см. perldoc -f setlocale
open(IN, "a.txt");
while(<IN>) {
chomp;
next if $_ eq ""; #next if !$_;
$hash{$_}++;
}
open(OUT, ">out.txt");
print OUT sort keys %hash;

На ++-се кода немногим больше. std::hash_map.

Delphi без сторонних реализаций хэша тебе не помощник.


 
Оливейра ©   (2002-11-24 02:03) [2]

Не, вру, можешь еще в базу данных вставить, затем отселектив ( и такой бред тут проскакивал... ). Если тебя скорость не волнует. Можно MSSQL напрячь :)) Он умеет шустро текстовые файлы в таблицы перегонять.

Или OLE DB драйвер для текстовых файлов поюзать :)


 
oomneeq ©   (2002-11-24 04:01) [3]


with TStringList.Create do begin
Sorted:=true;
Duplicates := dupIgnore;
Loadfromfile("D:\slova.txt");
Savetofile("D:\slova.txt");
Free;
end; // with

одна пустая строчка все же останется :-)


 
oomneeq ©   (2002-11-24 04:04) [4]

with TStringList.Create do begin
Sorted:=true;
Duplicates := dupIgnore;
Loadfromfile("D:\slova.txt");
Delete(Indexof(""));// теперь не останется!
Savetofile("D:\slova.txt");
Free;
end; // with



Страницы: 1 вся ветка

Текущий архив: 2002.12.05;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.022 c
4-14876
Dead Stark
2002-10-03 12:03
2002.12.05
Как получить занчения массива VT_UI2, запакованного в Variant?


14-14785
Neox
2002-11-13 22:42
2002.12.05
Сглаживание краев


6-14708
YDV
2002-08-17 10:03
2002.12.05
Доброго времени суток! TNMUDP закрывает OnCloseQuery у формы !!!


14-14797
LordOfSilence
2002-11-15 14:06
2002.12.05
Сегодня пятница. Извините, не удержался...


1-14580
KMI
2002-11-27 08:51
2002.12.05
Как осуществить поиск из своей программы в Excel?