Обратный расчет конверта для скорости умножения матриц
Я пытаюсь развить интуицию о том, насколько реализуемы / масштабируемы алгоритмы машинного обучения. Доминирующей стоимостью всегда являются умножения матриц, но, похоже, нет готового ресурса Google для объяснения того, как выполнить вычисления конверта для умножения матриц.
Характеристики машины, которую я использую: у нее четырехъядерный процессор Ivy Bridge с тактовой частотой 2,8 ГГц, 8 МБ общей кэш-памяти третьего уровня, скорость шины 5 ГТ / с и 16 ГБ ОЗУ. Запись переполнения стека говорит, что Ivy Bridge имеет пропускную способность 8 DP-flops / секунду. Как мне объединить все эти числа, чтобы получить приблизительную оценку в секундах того, сколько времени потребуется для умножения двух матриц двойной точности заданных размеров, при условии, что матрицы и их произведение могут храниться в ОЗУ одновременно?
0 ответов на вопрос
Похожие вопросы
-
6
Нужно ли иметь 3 модуля памяти DIMM для использования DDR3 или даже иметь возможность запуска 3-кана...
-
5
Почему фанат моего процессора гонит видео или виртуальные машины?
-
4
Есть ли определенное или ощутимое преимущество использования ECC RAM на настольном ПК?
-
-
2
Использование памяти iTunes
-
5
Как определить, какие надстройки Firefox используют больше всего памяти
-
5
Что мне делать со своей старой памятью?
-
3
Как определить, можно ли увеличить объем оперативной памяти с 2 до 4 ГБ на материнской плате ASUS P5...
-
6
Почему оперативная память для новых macbooks такая дорогая?
-
8
«Установить память попарно» Как это работает для 3 ГБ?
-
7
Куда делись остальные 0,8 ГБ ОЗУ?