Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Начинающим";
Текущий архив: 2008.02.24;
Скачать: [xml.tar.bz2];

Вниз

Поиск по текстам   Найти похожие ветки 

 
mrArmstrong   (2008-01-30 18:56) [0]

Собираю кар. файлы  что бы другой раз попеть, набралось уже более 10 тысяч. Встала проблема организовать поиск каров по словам в тексте песни. Вот в принципе и хочу проконсультироваться у специалистов как это дело обычно грамотно организовывается.
Пока две мысли:
- просто при сканировании каталога с караоке создаю таблицу с двумя полями: имя файла и текст караоке. При поиске буду пробегаться по записям и в тексте караоке буду искать нужные слова или по sql запросу буду фильтровать по условию вхождения нужных слов.
- второй вариант крутится как создание таблицы слов при сканировании и второй таблицы с полями имени файла и указателей текста песни на таблицу слов (пока ещё не надумал как это организовать)

вроде бы первый вариант прост, но меня пока смущает объём полученной базы и скорости поиска. второй вариант пока не до конца понял как организовать и есть ли смысл. хотя 10000 песен где текст песни около 3-5 кб....

вообщем знающие люди подскажите как это дело правильно организовывается или любые идеи.

За ранее большое спасибо!


 
clickmaker ©   (2008-01-30 19:05) [1]

MS SQL + FullTextSearch?


 
mrArmstrong   (2008-01-30 19:21) [2]

то есть вы предлагаете тупо хранить имя файла и текст песни?

я вот пытаюсь додумать второй вариант:

тут будут собираться все встречающиеся слова:
table myWord =
n: Integer
word: string

тут сами кар. файлы с указателями на текст:
table myKar
fileName: string
..
указатели текста песни на таблицу слов
как пока сделать грамотно не  придумал ;)

может он всё таки лучше, так как не нужно хранить все тексты и потом поиск будет мне кажется намного быстрее..


 
clickmaker ©   (2008-01-30 19:36) [3]


>  [2] mrArmstrong   (30.01.08 19:21)

да нет, не предлагаю.
Можно и по набору ключевых слов или фраз
т.е. одно слово может указывать на несколько файлов. Что-то типа хэш-таблицы
По фразам - более уникально. Хотя, если попса...


 
mrArmstrong   (2008-01-30 19:52) [4]

"Что-то типа хэш-таблицы" как раз у меня пока мыслей и нет)


 
clickmaker ©   (2008-01-30 20:02) [5]


> [4] mrArmstrong   (30.01.08 19:52)

t_Keyword(keyword_id, keyword)
t_Song(song_id, song_name)
t_SongKeywords(keyword_id, song_id)


 
Игорь Шевченко ©   (2008-01-30 21:05) [6]

Oracle + InterMedia


 
mrArmstrong   (2008-01-30 21:45) [7]

[b]Игорь Шевченко[/b]

ну ваще! написал бы ужо O+I  

:)


 
mrArmstrong   (2008-01-30 22:39) [8]

Информационное агентство InterMedia

Intermedia – Exchange hosting business email service and Web

ИА "Интермедиа консалтинг"

InterMedia - компьютерная компания!

InterMedia: Global Communications and Media Research

Intermedia Film

Регистрация доменных имен — «InterMedia.Names».

.......

можно поподробнее


 
ketmar ©   (2008-01-30 23:03) [9]

>[8] mrArmstrong (30.01.08 22:39)
«куда тебе целоваться-то, ты ведь облеванный весь!» (ц) Даун Хаус

в смысле — ты даже поиском пользоваться не умеешь, куда ж тебе софт-то писать…


 
mrArmstrong   (2008-01-30 23:14) [10]

Удалено модератором


 
ketmar ©   (2008-01-30 23:17) [11]

>[10] mrArmstrong (30.01.08 23:14)
это ты хотел наехать или пошутить? в любом случае у тебя не вышло ни то, ни то.

ну откуда опять клоунов понабежало? и как на подбор все несмешные…


 
ketmar ©   (2008-01-30 23:18) [12]

кстати. мне показалось, или неко приняло название фильма за имя собственное? наверное, я поспешил насчёт несмешных.



Страницы: 1 вся ветка

Форум: "Начинающим";
Текущий архив: 2008.02.24;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.47 MB
Время: 0.045 c
2-1201868796
Danco
2008-02-01 15:26
2008.02.24
форма


3-1191778975
3Lander
2007-10-07 21:42
2008.02.24
Вопрос по работе с IBX


15-1201244935
oldman
2008-01-25 10:08
2008.02.24
Татьянин день


15-1200903906
Ega23
2008-01-21 11:25
2008.02.24
Об особенностях FireBird


4-1183993259
AlexanderMS
2007-07-09 19:00
2008.02.24
Рисование с "прозрачным" цветом.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский