Потребляемая мощность графического процессора

302
user7573566

Я использую компьютер с 4 Nvidia Titan X для обучения глубоких нейронных сетей. У меня проблемы с энергопотреблением. Потребление Titan X не должно превышать 250 Вт, но, как видно на графике, оно может превышать 350 Вт. Когда я использую nvidia-smi для контроля энергопотребления, параметр принудительного ограничения мощности устанавливается равным 250 Вт, как и должно быть.

Log of power consumption

Сначала я подумал, что это не проблема, за исключением того, что я не могу запустить все 4 графических процессора одновременно на моем 1200-вольтовом блоке питания Corsair Axi. Однако, когда я попробовал другую нейронную сеть, более дорогую в вычислительном отношении на одном графическом процессоре, я вывел компьютер из строя. На самом деле я сжег БП и отправил его обратно. Сейчас я купил больший блок питания (1600 Вт), но не хочу, чтобы снова возникла та же проблема.

Я не помню, как блок питания был подключен, но возможно GPU я был подключен с чем - то подобным в этом, так как Titan х необходимо 2 PCI-E разъем и мой блок питания имел только 8 (4 * 2 для графических процессоров и 1 для процессора это недостаточно). Если да, то графический процессор был подключен к одному выходу pci-e вместо двух.

Возможно ли, что GPU потреблял больше, чем возможно на этой записи (40A, 480W) и сжег весь блок питания? Могу ли я на самом деле обеспечить ограничение мощности 250 Вт?

1
8-контактный разъем 150 Вт x2 плюс 75 Вт из слота pci-e = 375 Вт - это максимальное значение, которое следует извлечь. Это только номинальный предел для проводов, некоторые производители нарушают этот предел. cybernard 5 лет назад 0
Кроме того, 250 Вт максимум, который он может нарисовать, или средний максимум, который он вытягивает (таким образом, он может вытянуть больше и, вероятно, нагреться, а затем уменьшить скорость, таким образом, оставаясь на ** в среднем ** ниже 250 Вт в течение определенного периода времени). Hennes 5 лет назад 0
В этой теме рассказывается об ошибках nvidia-smi, связанных с: а) несколькими картами; б) относится к startx / stopx; и c) проблемы, когда iGPU не является первым перечисляемым устройством (с помощью фиктивных заглушек hdmi для перечисления устройства). Возможно, стоит потянуть всех, кроме одного, и протестировать, прочитать ветку для мозгового штурма и т. Д. (Https://devtalk.nvidia.com/default/topic/1011633/linux/nvidia-smi-power-limit-on-gtx-1060 - / 2) Yorik 5 лет назад 0

0 ответов на вопрос