Форум: "KOL";
Текущий архив: 2008.06.15;
Скачать: [xml.tar.bz2];
ВнизПредложение отказаться от ASM версии Найти похожие ветки
← →
Vladimir Kladov © (2007-09-18 17:33) [40]Да посмотрел fastmove именно так и работает. И правда на том же тесте даёт почти двойной прирост скорости. Тогда не буду уже свой доделывать, раз такой хороший есть. (Интересно почему нет быстрого FillChar, или считается что быстрее уже точно некуда).
← →
exero © (2007-09-18 17:36) [41]Великий расKOL... жаль.
← →
Sapersky (2007-09-18 17:59) [42]Да посмотрел fastmove именно так и работает. И правда на том же тесте даёт почти двойной прирост скорости.
Если fastmove <> FastCode, то посмотрите ещё и последний. Там долго и вполне успешно оптимизируют борландовскую RTL, кое-что вроде даже включено в BDS2006.
Хотя, ИМХО, если скорость программы зависит от функций вроде Move/FillChar - проблема скорее в алгоритме, чем в функциях.
← →
ANTPro © (2007-09-18 18:06) [43]
> [39] Vladimir Kladov © (18.09.07 17:20)
> Для меня использовать svn это просто увеличивать траффик.
Через toonel.net(сжатие трафика через прокси) огромная экономия.
← →
exero © (2007-09-18 18:11) [44]Что касается FastCode - тут впечатление у меня сложилось двоякое, вроде и есть небольшой прирост скорости, но иногда (так и не разобрался с чем это связано) программа работала медленне чем без них (обработка данных занимала секунды 2, хотя без замены около 0.7сек). Хотя возможно, тормозила только какая-то одна из функций. Поэтому из всей библиотеки FastCode пользуюсь только FastMove.
← →
Sapersky (2007-09-18 18:43) [45]Я, честно говоря, тоже не использую. В основном из-за того, что FastCode не оптимизируется под мой заслуженный краснознамённый P3 :) (на нём стандартные функции часто быстрее).
Ещё варианты, почему может тормозить:
1) Непроизвольное смешивание MMX и floating-point кода (в FastCode используется и то, и другое). Если за командой EMMS, заканчивающей MMX-код, следует FP, получается задержка в сколько-то там десятков тактов. Хотя, возможно, на современных CPU это несущественно.
2) MMX/SSE вообще-то требуют выравнивания данных, не помню, как в FastCode решена это проблема. По идее, универсальные функции должны сами как-то изощряться, а может, оставлено на программиста.
← →
Sapersky (2007-09-18 18:58) [46]... а Владимиру советую, чтобы он не тратил время на изобретение лишних велосипедов.
← →
GMax (2007-09-19 00:09) [47]>> (Интересно почему нет быстрого FillChar, или считается что быстрее уже точно некуда).
как это нету ? есть.
← →
Andrey_rus © (2007-09-19 03:48) [48]>как это нету ? есть.
Пусть лучше, а так и будет, производители микропроцессоров затачивают камни под ASM - REP.
← →
Vladimir Kladov © (2007-09-19 15:36) [49]Если бы я не тратил время на изобретение велосипедов, KOL"а бы не было.
← →
Sapersky (2007-09-19 18:10) [50]Я имею в виду, что ознакомившись с трудами предшественников, можно избежать создания моделей имеющих 2-3%-ное "преимущество".
FillChar там, кстати, тоже есть.
Впрочем, как хотите :)
Страницы: 1 2 вся ветка
Форум: "KOL";
Текущий архив: 2008.06.15;
Скачать: [xml.tar.bz2];
Память: 0.53 MB
Время: 0.007 c