Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2008.02.24;
Скачать: CL | DM;

Вниз

Поиск по текстам   Найти похожие ветки 

 
mrArmstrong   (2008-01-30 18:56) [0]

Собираю кар. файлы  что бы другой раз попеть, набралось уже более 10 тысяч. Встала проблема организовать поиск каров по словам в тексте песни. Вот в принципе и хочу проконсультироваться у специалистов как это дело обычно грамотно организовывается.
Пока две мысли:
- просто при сканировании каталога с караоке создаю таблицу с двумя полями: имя файла и текст караоке. При поиске буду пробегаться по записям и в тексте караоке буду искать нужные слова или по sql запросу буду фильтровать по условию вхождения нужных слов.
- второй вариант крутится как создание таблицы слов при сканировании и второй таблицы с полями имени файла и указателей текста песни на таблицу слов (пока ещё не надумал как это организовать)

вроде бы первый вариант прост, но меня пока смущает объём полученной базы и скорости поиска. второй вариант пока не до конца понял как организовать и есть ли смысл. хотя 10000 песен где текст песни около 3-5 кб....

вообщем знающие люди подскажите как это дело правильно организовывается или любые идеи.

За ранее большое спасибо!


 
clickmaker ©   (2008-01-30 19:05) [1]

MS SQL + FullTextSearch?


 
mrArmstrong   (2008-01-30 19:21) [2]

то есть вы предлагаете тупо хранить имя файла и текст песни?

я вот пытаюсь додумать второй вариант:

тут будут собираться все встречающиеся слова:
table myWord =
n: Integer
word: string

тут сами кар. файлы с указателями на текст:
table myKar
fileName: string
..
указатели текста песни на таблицу слов
как пока сделать грамотно не  придумал ;)

может он всё таки лучше, так как не нужно хранить все тексты и потом поиск будет мне кажется намного быстрее..


 
clickmaker ©   (2008-01-30 19:36) [3]


>  [2] mrArmstrong   (30.01.08 19:21)

да нет, не предлагаю.
Можно и по набору ключевых слов или фраз
т.е. одно слово может указывать на несколько файлов. Что-то типа хэш-таблицы
По фразам - более уникально. Хотя, если попса...


 
mrArmstrong   (2008-01-30 19:52) [4]

"Что-то типа хэш-таблицы" как раз у меня пока мыслей и нет)


 
clickmaker ©   (2008-01-30 20:02) [5]


> [4] mrArmstrong   (30.01.08 19:52)

t_Keyword(keyword_id, keyword)
t_Song(song_id, song_name)
t_SongKeywords(keyword_id, song_id)


 
Игорь Шевченко ©   (2008-01-30 21:05) [6]

Oracle + InterMedia


 
mrArmstrong   (2008-01-30 21:45) [7]

[b]Игорь Шевченко[/b]

ну ваще! написал бы ужо O+I  

:)


 
mrArmstrong   (2008-01-30 22:39) [8]

Информационное агентство InterMedia

Intermedia – Exchange hosting business email service and Web

ИА "Интермедиа консалтинг"

InterMedia - компьютерная компания!

InterMedia: Global Communications and Media Research

Intermedia Film

Регистрация доменных имен — «InterMedia.Names».

.......

можно поподробнее


 
ketmar ©   (2008-01-30 23:03) [9]

>[8] mrArmstrong (30.01.08 22:39)
«куда тебе целоваться-то, ты ведь облеванный весь!» (ц) Даун Хаус

в смысле — ты даже поиском пользоваться не умеешь, куда ж тебе софт-то писать…


 
mrArmstrong   (2008-01-30 23:14) [10]

Удалено модератором


 
ketmar ©   (2008-01-30 23:17) [11]

>[10] mrArmstrong (30.01.08 23:14)
это ты хотел наехать или пошутить? в любом случае у тебя не вышло ни то, ни то.

ну откуда опять клоунов понабежало? и как на подбор все несмешные…


 
ketmar ©   (2008-01-30 23:18) [12]

кстати. мне показалось, или неко приняло название фильма за имя собственное? наверное, я поспешил насчёт несмешных.



Страницы: 1 вся ветка

Текущий архив: 2008.02.24;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.018 c
15-1200664184
Evanescence
2008-01-18 16:49
2008.02.24
граббер в php


2-1201890405
Urvin
2008-02-01 21:26
2008.02.24
Вторая копия приложения в CodeGear


2-1201533405
fics
2008-01-28 18:16
2008.02.24
SaveDialog


15-1201184222
AntonUSAnoV
2008-01-24 17:17
2008.02.24
как оценить свой труд ?


15-1201100303
БарЛог
2008-01-23 17:58
2008.02.24
Самый лучший поисковик