Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2007.03.25;
Скачать: CL | DM;

Вниз

Разобрать текст на слова   Найти похожие ветки 

 
Джо ©   (2007-02-28 05:15) [40]

Да, действительно, это я напутал.


 
Alex Konshin ©   (2007-02-28 05:17) [41]

Там, правда, для команды перекодировки было ограничение длины 256 байт.
Но не помню уже, возможно в XA или 390 была добавлена команда для перекодировки длинных строк типа MVCL,CLCL.


 
Sha ©   (2007-02-28 09:19) [42]

> Ketmar ©   (28.02.07 04:08) [34]
> лучше траву. или грибочки. или что там ещё было?

как регулярно принимаешь?

> потому как "количества символов" в чём? в ASCII? в UNICODE? в строке?

начинай метлы юзать )


 
Sha ©   (2007-02-28 09:23) [43]

> RASkov   (28.02.07 00:58) [33]
>> Проверять-то все символы, конечно, надо.
>> Вот только количество проверок может быть много меньше количества
>> символов.

> Не сходится:)

выходит, что s / t > 1,
где s - количество символов в строке, t - количество сравнений

Может так че-нить щелкнет? )


 
Sha ©   (2007-02-28 09:36) [44]

> RASkov   (28.02.07 00:58) [33]

в догонку:
в контексте предыдущего поста "сравнения" сказано в смысле "проверки",
т.е. в частности это может быть использование лукап-таблицы.


 
Ketmar ©   (2007-02-28 12:16) [45]

> Sha ©   (28.02.07 09:19) [42]
да с удовольствием. причём метлу, наверное, придётся съесть. иначе я пост так и не пойму. можно "на пальцах", а? специально для дворников?


 
Ketmar ©   (2007-02-28 12:18) [46]

> Sha ©   (28.02.07 09:36) [44]
хм. ты намекаешь на интерпретацию строки как набора word"ов, например? если да, то не надо спешить с фотографией. всё равно это проверяет все символы строки.


 
wicked ©   (2007-02-28 12:33) [47]

> Ketmar ©   (28.02.07 12:18) [46]
нет, он намекает на что-то Бойеро-Муровско-подобное, но что именно - ума не приложу - алгоритм Бойера-Мура тут не подойдет....
будем есть метлы вместе :)


 
Sha ©   (2007-02-28 12:39) [48]

> Ketmar ©   (28.02.07 12:18) [46]

О том и речь, что проверены будут все символы,
но количество проверок меньше количества символов.

ЗЫ А фотку с метлой пришли )


 
wicked ©   (2007-02-28 12:43) [49]

> Sha ©   (28.02.07 12:39) [48]
(дергая за полу пиджака)
дядь, не томите, расскажите, а?

интересно же ведь...


 
Ketmar ©   (2007-02-28 12:44) [50]

> Sha ©   (28.02.07 12:39) [48]
да сколько угодно проверок. я-то говорил не про количество проверок, а про то, что все символы проверять надо. %-) хоть ты SSE заюзай -- всё равно проверять все.

зыж а вот не пришлю. потому что гад.

> wicked ©   (28.02.07 12:33) [47]
неа. насколько я понял -- array [Word] и ты ды. действительно, проверок меньше. но смысл от этого не меняется -- что байты проверять, что слова, что двойные слова...

кстати, ещё неизвестно, что быстрее: по символам или по таблице в 64 кила, которая загадит кэш. %-)


 
wicked ©   (2007-02-28 12:52) [51]

> Ketmar ©   (28.02.07 12:44) [50]
я вот думаю - а мы собрались молотить гигабайты в секунду?...
на современных мощностях простой автомат на два состояния с табличкой плохих/хороших символов позволит молотить мегабайты и десятки мегабайт в секунду... и узким местом там будет не сам разбор, а "подвоз патронов" - ввод и вывод данных...
а 64к табличка, афаир, вся в кеш влезет и еще место будет - так что и иероглифы молотить можно


 
Sha ©   (2007-02-28 12:57) [52]

> wicked ©   (28.02.07 12:43) [49]

один из вариантов  - лукап массив вордов,
другой - обрабатывать по 4 байта аналогично алгоритму поиска терминатора строки
как изменится скорость - большой вопрос, конечно.

> Ketmar ©   (28.02.07 12:44) [50]
> да сколько угодно проверок. я-то говорил не про количество проверок...

а всплеск эмоций Ketmar ©   (28.02.07 04:08) [34] был наверно по поводу
того что "всё равно проверять все" )))

> кстати, ещё неизвестно, что быстрее

это да


 
Sha ©   (2007-02-28 13:09) [53]

> wicked ©   (28.02.07 12:52) [51]
> узким местом там будет не сам разбор, а "подвоз патронов" - ввод и вывод данных...

Совершенно верно.
Иногда бывает, что разница в скорости стрельбы и скорости "отвоза" превышает порядок.
И здесь, похоже, тот самый случай.


 
Ketmar ©   (2007-02-28 13:16) [54]

> wicked ©   (28.02.07 12:52) [51]
вместо этой таблички можно что-нибудь полезное туда положить. %-)

> Sha ©   (28.02.07 12:57) [52]
по поводу криво сформулированной фразы. и нескольких литров крепкого пива внутри Кэтмара. %-)

и вообще -- может, на меня яркий цвет значка так действует? может, я завидую?! %-)

> Sha ©   (28.02.07 13:09) [53]
> Иногда бывает, что разница в скорости стрельбы и скорости
> "отвоза" превышает порядок.

так мы, по-моему, давно уже обсуждаем сферического коня. %-)


 
Anatoly Podgoretsky ©   (2007-02-28 20:32) [55]

> Ketmar  (28.02.2007 12:16:45)  [45]

Количество символов не зависит от длины символа.


 
Ketmar ©   (2007-02-28 20:50) [56]

> Anatoly Podgoretsky ©   (28.02.07 20:32) [55]
это понятно. но мы не о том. %-)



Страницы: 1 2 вся ветка

Текущий архив: 2007.03.25;
Скачать: CL | DM;

Наверх




Память: 0.57 MB
Время: 0.04 c
15-1172918421
wsw
2007-03-03 13:40
2007.03.25
Как вычилсить корень из числа типа int64? sqrt() - не помогает!


4-1163149202
Natalex
2006-11-10 12:00
2007.03.25
Запуск компоненты TService


2-1172743088
марина
2007-03-01 12:58
2007.03.25
вывод файла


2-1173020828
kop
2007-03-04 18:07
2007.03.25
DataPump


15-1173018283
arturich
2007-03-04 17:24
2007.03.25
Ошибка компилятора при установке EmbeddedWB