Неожиданные результаты скорости вычислений

VladGuardian · Отправлено: 26.01.14 16:02:53

РЕЗУЛЬТАТ СКОРОСТИ ДЛЯ УМНОЖЕНИЯ:

VladGuardian · Отправлено: 26.01.14 16:06:51

...попробовать умножение?

Добавлено спустя 9 минут:

Добавляю результаты в первый пост (обновляется)...

VladGuardian · Отправлено: 26.01.14 16:23:58

Я сделал правильнее, потому что инкремент цикла (i++) и сравнение (i

Archi]ASTS[ · Отправлено: 26.01.14 16:31:22

Препроцессор все равно его изменит под цикл, лол.

O2:

Скрытый текст:

VladGuardian · Отправлено: 26.01.14 16:33:02

вообще бессмыслен, неужели не очевидно?

VladGuardian · Отправлено: 26.01.14 17:13:35

С одной махонькой поправочкой - ГРУППОВЫЕ операции с элементарными типами данных.
Как это часто бывает в реальных алгоритмах, операции происходят над ОДИНОЧНЫМИ числами, а не над векторами(массивами) чисел.

c4tnt · Отправлено: 26.01.14 17:18:51

Так не бывает(тм)

Если можно оперировать только с одиночными числами, а в вектор они никак не собираются, то это значит что либо в алгоритме ещё килограмм ветвлений на квадратный сантиметр кода, либо есть только один вычислительный блок, результаты которого зависят от вычисления предыдущего блока. В тесте, кстати, результат следующего вычисления от предыдущего не зависит, поэтому fpu могло довольно быстро асинхронно считать целые стопки чисел. Это надо дизасм смотреть опять же. Второй вариант - сделать тестируемую зону с использованием _asm вставки чтобы всё однозначно было.

VladGuardian · Отправлено: 26.01.14 17:43:23

Пример одной из тестовых функций: