Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.12.10;
Скачать: CL | DM;

Вниз

Запись в таблицу и поиск   Найти похожие ветки 

 
MixAnOL ©   (2006-10-04 16:21) [0]

Здарова Всем!

Возник вопрос, мне нужно организовать поиск среди нескольких десятков тысяч текстовых строк. Т.е. выбрать строки соответствующие, например, шаблону "йц*". Причем набор строк строится  динимически.
Вот и думаю как это сделать, что бы поиск занимал минимальное кол-во времени.
Подумал, что можно загонять в таблицу и SQL LIKE мне там поможет... и соответственно возник вопрос какую СУБД использовать.

Где-то видел, но не смог сейчас найти, компоненты поддерживающие SQL для простых таблиц...


 
Desdechado ©   (2006-10-04 16:24) [1]

Если тебе только по первым символам искать, то никакой SQL и СУБД 100 леи не нужен. Просто сортируешь свой TStringList и потом в сортированном это ищется моментально. Можешь свой двоичный или другой поиск подключить.

Кстати, если не по первым символам искать, то LIKE в SQL не будет использовать индекс, т.е. все равно толку нет.


 
Stanislav ©   (2006-10-04 16:25) [2]

MSACCESS подойдет, если одновременно будет работать 1 пользователь.
А на текстовое поле нужно поставить индекс.


 
MixAnOL ©   (2006-10-04 16:41) [3]


> MSACCESS подойдет, если одновременно будет работать 1 пользователь.
>
> А на текстовое поле нужно поставить индекс.

А тормозить не будет, если я туда 80000 строк текста[255] закорячу?

> если не по первым символам искать

нужно не только по первым...


 
Stanislav ©   (2006-10-04 16:44) [4]

MixAnOL ©   (04.10.06 16:41) [3]
недолжно.


 
MixAnOL ©   (2006-10-04 16:51) [5]

там в акцесе вроде фишка была, что при delete from table1, сами записи не удаляются, т.е. если я 100 раз засуну в таблицу по 80000 строк, то у меня база нехилая станет по размеру..


 
Sergey13 ©   (2006-10-04 16:55) [6]

> [3] MixAnOL ©   (04.10.06 16:41)

А откуда эти 80000 строк?


 
AngeL B.   (2006-10-04 16:58) [7]


> нужно не только по первым...

А тогда всё равно что использовать, потому что поиск всё равно будет линейным.

Можно и просто TStringList вместе с for-ом и pos-ом


 
sniknik ©   (2006-10-04 17:04) [8]

> там в акцесе вроде фишка была, что при delete from table1, сами записи не удаляются
эта фишка практически в любой базе... (так сразу и не вспомнить где этого нет...)

> т.е. если я 100 раз засуну в таблицу по 80000 строк, то у меня база нехилая станет по размеру..
> 80000 строк текста[255] с текстом "под завязку" до последнего байта, это примерно 40мег. 100 ра это 400 мег., пока до 1,5 гигбайта не дойдет можеш не буспокоиться, а место из под удаленных записей используется повторно...

> Можно и просто TStringList вместе с for-ом и pos-ом
движок базы скорее всего сделает это более оптимальным способом. сравнить бы надо.


 
MsGuns ©   (2006-10-04 17:10) [9]

>Stanislav ©   (04.10.06 16:25) [2]
>MSACCESS подойдет, если одновременно будет работать 1 пользователь.

Глупость

>А на текстовое поле нужно поставить индекс.

Еще одна.


 
MixAnOL ©   (2006-10-04 17:10) [10]


> движок базы скорее всего сделает это более оптимальным способом

вот почему мне и не охота руками поиск делать...


 
Stanislav ©   (2006-10-04 17:12) [11]

MsGuns ©   (04.10.06 17:10) [9]
?


 
sniknik ©   (2006-10-04 17:20) [12]

> MsGuns ©   (04.10.06 17:10) [9]
> ?
поиск внутри строки индексов не использует, а к базе аксесса разрешено до 5ти подключений с одной машины (вернее там сформулировано более хитро, типа "гарантируется работа" или типа того, не хочу смотреть в доку лень, а на самом деле позволяется гораздо больше)


 
Stanislav ©   (2006-10-04 17:27) [13]

sniknik ©   (04.10.06 17:20) [12]

Для многопользовательской работы может подойти больше другая БД.
А индекс используется при Like "йц*". , не используется в Like "*йц*", во всяком случае в MSSQL.


 
MsGuns ©   (2006-10-04 17:33) [14]

>Stanislav ©   (04.10.06 17:27) [13]
>Для многопользовательской работы может подойти больше другая БД.

Для организации многопользовательской работы нужна прежде всего другая ТЕХНОЛОГИЯ. А уже потом "другая БД".

>А индекс используется при Like "йц*". , не используется в Like "*йц*", во всяком случае в MSSQL.

Поинтересуйтесь механизмом использования индексов "серверными поисковиками" (например, в том же BOL для MS SQL) и много чего узнаете. Например то, что в некоторых случаях создание "лишних" индексов может существенно ЗАМЕДЛИТЬ поиск и (особенно !) выборку.


 
sniknik ©   (2006-10-04 17:45) [15]

> Для многопользовательской работы может подойти больше другая БД.
это вовсе не одно и тоже с "аксесс может работать только с одним пользователем".

> А индекс используется при Like "йц*". , не используется в Like "*йц*", во всяком случае в MSSQL.
под фразу в [12] "внутри строки" подходит только второй вариант, т.к. первый это будет вначале. т.е. ты повторил сказаное в [12] только своими словами... не пойму, повторение является ответом? или есть какойто другой, тайный смысл послания?


 
Stanislav ©   (2006-10-05 08:44) [16]

1. На момент моего ответа [2]. речь нешлп о поиске внутри строки, поэтому индекс был просто необходим.
2. Даже при поиске либо внутри строки либо по первым буквам индекс такж е необходим, т.к. при поиске внутри строки он просто использоваться не будет, а при поиске по первым буквам скорость поиска увеличиться в разы.
К тому же автору захочется отсортировать найденый материал, где индекс также необходим.
3. MsGuns ©   (04.10.06 17:33) [14]  Я отлично знаком с индексами и могу уверить что это не тот случай где индекс может мешать выборке.
4. А для развеевания сомнений MsGuns ©  мы попросим MixAnOL © произвести тест на производительность с индексом и без и опубликовать результаты, если конечно MixAnOL © не против.
со sniknik © по поводу Access спорить не буду, но обращаю внимание что я не говорил что акцесс может работать с одним пользователем
MSACCESS подойдет, если одновременно будет работать 1 пользователь - это несет совершенно другой смысл.
Исходя из вышесказанного можно с полной уверенностью заявить что глупости были высказаны в [9] , [14].
А в [2] ответы на вопросы изложенные в автором.
ВОТ!


 
Sergey13 ©   (2006-10-05 09:02) [17]

> Причем набор строк строится  динимически.

Если это происходит перед каждым поиском, то использование БД, ИМХО, вообще нецелесообразно.


 
MsGuns ©   (2006-10-05 10:18) [18]

>Stanislav ©   (05.10.06 08:44) [16]
>Исходя из вышесказанного можно с полной уверенностью заявить что глупости были высказаны в [9] , [14].

Блажен кто верует ;)

>А в [2] ответы на вопросы изложенные в автором.

А в [2] есть ответы на поставленные вопросы ?


 
MixAnOL ©   (2006-10-05 11:58) [19]


> мы попросим MixAnOL © произвести тест на производительность
> с индексом и без и опубликовать результаты, если конечно
> MixAnOL © не против

не против, как только будут результаты - откину сюда, самому интересно...


 
Stanislav ©   (2006-10-05 15:10) [20]

Чтобы дальше не спорить привожу результаты своего теста
Тест проводился на ACCESS c таблицей в 316945 записей,
Размер текстового поля - 100 знаков
Максимальная длинна внесенной строки состовляет 35 знаков
Запрос:SELECT Count(*) AS CNT
FROM dbo_SOSTDET
WHERE (((dbo_SOSTDET.NOMDOK) Like "%37%"));
Вот результаты
параметр-колво записей - время в сек без инд. - время в сек с индексом
%37 - 854 - 0,045 - 0,045
37 - 39 - 0,06 - 0,04
37% - 1425 - 0,044 - 0,0006
%37%-3504-0,045-0,045



Страницы: 1 вся ветка

Текущий архив: 2006.12.10;
Скачать: CL | DM;

Наверх




Память: 0.5 MB
Время: 0.059 c
1-1162125556
Yuiop
2006-10-29 15:39
2006.12.10
Конвертировать из Rave в *.doc


15-1163765456
Elen
2006-11-17 15:10
2006.12.10
Нужна библиотека материалов


1-1162197747
Andrewk88
2006-10-30 11:42
2006.12.10
Подключение dll созданной в VS2k3


15-1163941673
Alexey_k
2006-11-19 16:07
2006.12.10
книги


2-1164536274
Ded222
2006-11-26 13:17
2006.12.10
Программа занимает 20 мб памяти в Диспетчере задач.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский