Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2002.12.05;
Скачать: CL | DM;

Вниз

Посоветуйте, пожалуйста, как лучше отсортировать текстовый файл.   Найти похожие ветки 

 
FLAW ©   (2002-11-24 00:15) [0]

У меня есть большой ТХТ-файл (рус.) в каждой строке которого записано одно слово. Посоветуйте, пожалуйста, как лучше:
1) Удалить повторяющиеся слова.
2) Удалить пустые строки.
3) Расположить слова по алфавиту, причем при добавлении нового должна осуществляться проверка на повтор и новое слово так же должно расположиться в файле по алфавиту.
Прошу подробней, я же "чайник".
Заранее благодарю.


 
Оливейра ©   (2002-11-24 01:57) [1]

Если эту задачу надо выполнять кажный день или чаще:
1) Качаешь Perl с ActiveState
2)
# sort.pl
use POSIX;
use locale;

setlocale("чего-то-там-Ru_ru"); #см. perldoc -f setlocale
open(IN, "a.txt");
while(<IN>) {
chomp;
next if $_ eq ""; #next if !$_;
$hash{$_}++;
}
open(OUT, ">out.txt");
print OUT sort keys %hash;

На ++-се кода немногим больше. std::hash_map.

Delphi без сторонних реализаций хэша тебе не помощник.


 
Оливейра ©   (2002-11-24 02:03) [2]

Не, вру, можешь еще в базу данных вставить, затем отселектив ( и такой бред тут проскакивал... ). Если тебя скорость не волнует. Можно MSSQL напрячь :)) Он умеет шустро текстовые файлы в таблицы перегонять.

Или OLE DB драйвер для текстовых файлов поюзать :)


 
oomneeq ©   (2002-11-24 04:01) [3]


with TStringList.Create do begin
Sorted:=true;
Duplicates := dupIgnore;
Loadfromfile("D:\slova.txt");
Savetofile("D:\slova.txt");
Free;
end; // with

одна пустая строчка все же останется :-)


 
oomneeq ©   (2002-11-24 04:04) [4]

with TStringList.Create do begin
Sorted:=true;
Duplicates := dupIgnore;
Loadfromfile("D:\slova.txt");
Delete(Indexof(""));// теперь не останется!
Savetofile("D:\slova.txt");
Free;
end; // with



Страницы: 1 вся ветка

Текущий архив: 2002.12.05;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.012 c
6-14700
daan_m
2002-10-06 14:26
2002.12.05
Как загрузить прогу на удалённом компе в локальной сети;


1-14572
alvin
2002-11-27 08:37
2002.12.05
Реестр в WinAPI


6-14706
and1
2002-10-09 21:00
2002.12.05
hab, switch


4-14886
Tihas
2002-10-10 03:13
2002.12.05
У меня вопросик как работать правильно с MoveWindow


1-14635
IKiller
2002-11-25 11:40
2002.12.05
Пропадают компоненты в палитре