Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2004.10.17;
Скачать: [xml.tar.bz2];

Вниз

Асм рулит?   Найти похожие ветки 

 
debuger ©   (2004-09-30 17:45) [0]

Доброго времени суток.

Вопрос такой: рулят ли(по скорости канешна) асмовые вставки.
Если предидущий ответ положителен, дайте линки на доку по написанию таковых. Произвожу только вычисления(что-то на ковго-то умножить, отнять, усреднить), т.е. проэкт мой чисто вычислительного характера.


 
Суслик ©   (2004-09-30 17:50) [1]

Асм вставки делают исключительно для кртости. Т.е. кто делает, тот крут. Кто не делает, тот ламер.

Глупый ответ, на групый вопрос.


 
Ega23 ©   (2004-09-30 17:52) [2]

Кстати, в слове Debugger два "g"


 
begin...end ©   (2004-09-30 18:07) [3]


> Вопрос такой: рулят ли(по скорости канешна) асмовые вставки.

Зависит от качества вставок.


 
icebeerg ©   (2004-09-30 18:15) [4]

> Вопрос такой: рулят ли(по скорости канешна) асмовые вставки.

и от количества вставок в общем ебеме программного кода


 
debuger ©   (2004-09-30 18:15) [5]

2 Ega23. Кстати при выборе ника, него отношение к реальной жизни не рассматривалось.

Остальным пасиба.


 
VMcL ©   (2004-09-30 18:15) [6]

>>debuger ©  (30.09.04 17:45)

Рульность асмовских вставок зависит от их написателя, от процессора и от оптимизатора. Оптимизатор ЯВУ может так соптимизировать код, что и ручная оптимизация ничего не улучшит (для данного процессора).


 
debuger ©   (2004-09-30 18:28) [7]

Пасиба, только я в асме не ногой. Дайте линки на нармальные доки по написанию этих вставок.


 
Суслик ©   (2004-09-30 18:29) [8]

Для оптимизации программы должны быть серьезные предпосылки.
Ты уверен, что они у тебя есть?


 
debuger ©   (2004-09-30 18:35) [9]

Да!
Не хватает процессорного времени на перещет всей трататни.
Я и так висю на 1.5 Г. И сказать заказчику, что комп не менее 2.5 Г, почему-то мое руководство не хочет.


 
Суслик ©   (2004-09-30 18:38) [10]


>  [9] debuger ©   (30.09.04 18:35)
> Да!
> Не хватает процессорного времени на перещет всей трататни.
> Я и так висю на 1.5 Г. И сказать заказчику, что комп не
> менее 2.5 Г, почему-то мое руководство не хочет.


Понимаешь в чем дело, писать на асме несложно. Писать оптимально сложно. На это нужен опыт. И опыт большой. Этому за месяц не научисся.

Зачастую оптимальность алгоритма заключена в самом алгоритме :)))
Посмотри - может у тебя этот случай.


 
DiamondShark ©   (2004-09-30 18:40) [11]

Может тогда лучше алгоритмом заняться?
Книжки по численным методам почитать...


 
Игорь Шевченко ©   (2004-09-30 18:40) [12]


> Дайте линки на нармальные доки по написанию этих вставок.


www.yandex.ru


 
debuger ©   (2004-09-30 18:46) [13]

Спасиба всем.
Алгоритм у меня нормальный (просто требование к системе злые), книжек по ЧМВ начитался(и они не используются).
Построением алгоритмов занимаюсь дольше чем их программингом, и давно строю довольно приличные по оптимальности.


 
Суслик ©   (2004-09-30 18:49) [14]


>  [13] debuger ©   (30.09.04 18:46)
> Спасиба всем.
> Алгоритм у меня нормальный (просто требование к системе
> злые), книжек по ЧМВ начитался(и они не используются).
> Построением алгоритмов занимаюсь дольше чем их программингом,
> и давно строю довольно приличные по оптимальности.


Ты не горячись. Я же с тобой пиво не пил, деталей знать не могу.

Просто твое желание использовать асм и получить серьезную выгоду очень легкомысленно. Что и наводит на мысль о совете продумать алгоритм.


 
TUser ©   (2004-09-30 19:15) [15]

Рулят, если писать их с умом. Т.е. ты олжен точно знать, как эту задачу решает компилятор/оптимизатор (напр., посмотреть в CPU), хорошо понимаь алгоритм, и понимать, на чем твой алгоритм выигрыват, а в чем он хуже, и каков баланс.

Недавно здесь проскакивала ссылочка, по которой я нашел текст, об оптимизации асмовского кода для Пентиумов. Лежит на работе, завтра могу выслать (только помылу попроси).


 
Anatoly Podgoretsky ©   (2004-09-30 19:27) [16]

Искать особо и не нужно - Intel.com оптимизация кода для процессоров Пентиум, но если ты совсем не знаешь ассемблера, то как правило результат по скорости хуже чем на Паскале.
Кроме того меня смущает твое заявление об 1.5 гб, у тебя что программа такого размера, весьма сомневаюь, значит алгоритмы.


 
Palladin ©   (2004-09-30 19:33) [17]

ИМХО
Здесь дело не в АСМовских вставках. Возможно имеет место пооптимизировать алгоритм обработки...


 
jack128 ©   (2004-09-30 19:46) [18]

Anatoly Podgoretsky ©   (30.09.04 19:27) [16]
Кроме того меня смущает твое заявление об 1.5 гб, у тебя что программа такого размера, весьма сомневаюь, значит алгоритмы.


Да нет, человек имеет в виду, что его прога висИт на проце 1.5 гигагерца


 
GuAV ©   (2004-09-30 20:01) [19]


> Асм рулит?

http://delphimaster.net/view/1-1096054352/


 
debuger ©   (2004-09-30 20:24) [20]

интерессная эпопея.


 
GuAV ©   (2004-09-30 21:21) [21]


> интерессная эпопея.

про биты в байте ещё интереснее было...


 
Никита ©   (2004-09-30 21:31) [22]

Можно оптимизировать любой код до максимального быстродействия.
А можно и асм вставку написать так чтоьы все грузилось полчаса.


 
GuAV ©   (2004-09-30 21:49) [23]

Никита ©   (30.09.04 21:31) [22]

да. именно к такому выводу и приводят ветки про биты и про поиск.


 
debuger ©   (2004-09-30 22:12) [24]

%)


 
Alekc   (2004-09-30 22:57) [25]

Кстати, по поводу оптимизатора ЯВУ... напишите в дельфи несколько строчек "<variable> := 0;" и посмотрите на код после компиляции... если он на простейшем примере столько лишнего лепит, то что же будет на сложных циклах ?...


 
GuAV ©   (2004-09-30 23:05) [26]

Alekc   (30.09.04 22:57) [25]

Он оптимизирует достаточно хорошо в большинстве реальных ситуации. Всё же это не искуственный интеллект.
Он действует по шаблонам.
Например есть известный случай, такое часто бывает:
mov  ebx, eax
mov  eax, ebx


 
Amoeba ©   (2004-10-01 10:23) [27]

Если очень нужно, то материалы по asm"у на русском найдешь на сайте А.Подгорецкого


 
Sens ©   (2004-10-01 10:45) [28]

to debuger
А может опишешь задачу, которую пытаешься решить?
Как-то мне не понятно, какая такая задача может тормозить на 1,5Г???

У меня был неописуемый случай, когда сам свою прогу оптимизировал по скорости работы в ... очень много раз (скажу что в 1000-чи, не поверят). А задача была - разобрать log файл сквида и запихать его в базу (Access) для дальнейшей обработки.
~650000 строк сейчас обрабатывается на cel 1800 ~25сек (разбор строк, занесение в базу и предварительная обработка запросов), до этого было около 4-х часов. (АСМ не использовал).

Так что нужно с алгоритмом разобраться, а потом только думать об асме.

С уважением.


 
Erik1 ©   (2004-10-01 11:10) [29]

Возможно дела не в самом алгоритме как таковом, а в вмособе его применения. Например как там выделяется память, что используется в качестве буфера, как передаются параметры, имеется ли рекурсия и пр... Все это относится не к матиматике алгоритма, а имено к програмированию. Вот это вам и могут здесь подсказать, к томуже небывает идеальных алгоритмов!


 
Defunct ©   (2004-10-01 11:19) [30]

> Вопрос такой: рулят ли(по скорости канешна) асмовые вставки.
> Произвожу только вычисления(что-то на ковго-то умножить, отнять, усреднить), т.е. проэкт мой чисто вычислительного характера.

Ты работает с видео?
Если да, тогда тебе прямой путь с использованию SSE2
есть команды параллельного умножения и сложения сразу нескольких (4-х операдов с плавающей запятой).

> Если предидущий ответ положителен, дайте линки на доку по написанию таковых.

www.intel.com

Instruction Set Reference vol 2A-B.
Programming Guige vol 3

2 debuger: напиши здесь код какой-нить простенькой функции, которую ты наиболее часто используешь.


 
DSA ©   (2004-10-01 12:05) [31]

Имею опыт написания асемблерных вставок. Результат:
1 Ассемблерные вставки сильно скорость не подымают. Штатный оптимзатор кода работает достаточно хорошо. Можно неделю кодить и обнаружить, что получаещь увелечение скорости 3-5%.
2 Много с этими вставками бился - пришел к выводу: попутки "вылизать" код - безполезная трата времени (убиваеться многог времени а реальный приост - единицы, реже десятки процентов). Единственный путь - глобальная оптимизация алгоритма с "ранним" отсечением тупиковых ветвей для просчета.
3 единственный путь оптимизации за счёт асм. вставок - использование ММХ и SSE инструкций с оптимизацией под конкретный процессор (заточка кода под особенности конвеера команд процессора). В этом случае возможно получить реальный результат.


 
Рыба ©   (2004-10-02 21:06) [32]

Интересно, можно ли ускорить стандартную функцию Round?

from System.pas

procedure       _ROUND;
asm
       { ->    FST(0)  Extended argument       }
       { <-    EDX:EAX Result                  }

       SUB     ESP,8
       FISTP   qword ptr [ESP]
       FWAIT
       POP     EAX
       POP     EDX
end;


К примеру, сделать специально для типа Double?


 
GuAV ©   (2004-10-02 21:11) [33]

Рыба ©   (02.10.04 21:06) [32]

Управлением Coprocessor Control Word можно понизить точность FPU. Однако не советую.

Приведенную функцию переписывать не нужно.


 
Рыба ©   (2004-10-02 21:15) [34]

> GuAV ©  (02.10.04 21:11) [33]

ОК.


 
debuger ©   (2004-10-03 17:04) [35]

У меня распознавание видеопотока в риальном времени.
Тромозили две вещи:
- съем данных
- паганая рекусрия, которую быстро не опишешь.

Переписал первое, к скорости прибыло 3х.
Второе, особо сильно пока не прилизывается.

Все пасибо. Асма пока не хочу :)


 
jack128 ©   (2004-10-03 21:49) [36]

DSA ©   (01.10.04 12:05) [31]
Штатный оптимзатор кода работает достаточно хорошо. Можно неделю кодить и обнаружить, что получаещь увелечение скорости 3-5%.

смотри ветку, ссылку на которую дал GuAV. там ускорение в разы..


 
GuAV ©   (2004-10-03 22:04) [37]


>  там ускорение в разы..

..однако Sha привел процедуру без асм, котороя тоже дала ускорение в разы.

довольно часто изменение алгоритма даёт больше ускорение чем переписывание на асм.


 
Рыба ©   (2004-10-03 22:46) [38]

Кто-нибудь скажет зачем в генерируемом коде много идущих друг за другом строк:
add  [eax], al


 
GuAV ©   (2004-10-03 23:29) [39]

Это тупо нули. Заполнение места. Чтобы процедуры были по смещению кратному 4.


 
debuger ©   (2004-10-04 18:49) [40]

а почему тогда не nop"ы?



Страницы: 1 2 вся ветка

Форум: "Основная";
Текущий архив: 2004.10.17;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.55 MB
Время: 0.036 c
6-1091709206
R2D2
2004-08-05 16:33
2004.10.17
PByteArray


1-1096946597
Phoenix
2004-10-05 07:23
2004.10.17
Cохранить позицию в TreeView


14-1096003397
1008
2004-09-24 09:23
2004.10.17
Мда.


6-1092235218
Павел
2004-08-11 18:40
2004.10.17
Динамические массивы.


14-1096269662
Layner
2004-09-27 11:21
2004.10.17
Американская винда не правильно определяет кол-во





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский