Как включить отключенные потоковые процессоры (SM)?

1607
skm

Я использую графический процессор NVIDIA Quadro K2000. Я побежал deviceQuery.exe, результаты которого ниже. Это говорит о том, что у меня только 2 единицы СМ. Я не уверен, действительно ли у меня только 2 SM или некоторые из них отключены, как указано в третьем комментарии к этому вопросу SO .

Я также видел, что количество SP составляет 192 на SM. Может быть, есть какой-то способ включить больше SM, и тогда количество SP на SM будет уменьшено.

образ

Обновление: причина, по которой я спрашиваю, заключается в том, что я хочу, чтобы моя обработка на GPU была эффективной. У меня есть изображение 1080 x 1920, которое я разделил на три сегмента. Я передаю эти сегменты H2D, обрабатываю и переношу D2H асинхронно. Поэтому я хочу выбрать такой размер блоков и количество потоков на блок, который может эффективно использовать аппаратную конфигурацию моего графического процессора. Кроме того, я все еще не уверен, что графический процессор с более чем 2 SM (скажем, 8 SM), но меньшим количеством SP на SM (384/8 = 48 SP на SM) будет работать так же, как GPU с 2 SM и 192 SP на СМ? Я имею в виду, имеет ли значение общее количество доступных SP?

-1
Вполне возможно, что дополнительные блоки будут отключены путем генерации определенных важных связей на матрице физического чипа и ** не могут быть ** повторно включены каким-либо образом с помощью программного или аппаратного обеспечения. Это вполне вероятно, чтобы предотвратить то, что вы хотите. Хотя некоторые из этих SM * могут * на самом деле функционировать, кроме отключения, также возможно, что они отключены, потому что они работали со сбоями во время тестирования. Покупать то, что вам действительно нужно, намного проще, чем самое дешевое, и надеяться, что вы сможете снова включить отключенные детали. Mokubai 8 лет назад 0
@Mokubai: NVIDIA Quadro K2000 поддерживает 3.0. Это почти новое поколение GPU. Вы действительно думаете, что это должно быть только 2 SM. Где бы я ни читал о графических процессорах, они говорят, что у графических процессоров обычно 2-30 SM. И я не могу поверить, что у этого последнего GPU есть только 2 SM. skm 8 лет назад 0
Учитывая, что K2000 находится на стороне «Quadro Bucket» линии Quadro, меня ничто не удивит. См. Https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units#Quadro_Kxxx_Series для подтверждения того, что у вас есть 2 ** функциональных ** модуля SMX. У вас, по всей вероятности, есть микросхема, которая имеет гораздо больше модулей SMX, но они, вероятно, будут ** физически ** отключены, либо из-за их неисправности, либо из-за лазерной резки дорожек. Mokubai 8 лет назад 1
Вашему «последнему» GK107, по сути, более трех лет, он является нижней частью и имеет ровно 2 SMX, каждый с 192 ядрами: http://www.tomshardware.com/reviews/geforce-gt-640- обзор, 3214.html (ваш K2000 - просто версия этой карты Quadro). И нет никаких волшебных программных команд, которые скажут транзисторам на кремнии реорганизоваться. Все эти вопросы просто покупатели сожалеют или у вас есть основополагающая причина, чтобы спросить это? talonmies 8 лет назад 0
@talonmies: я не написал причину, чтобы задать этот вопрос, потому что кто-то в SO сказал не задавать аппаратные вопросы там. Итак, здесь я только что спросил о проблеме с оборудованием. В любом случае, я обновил свой вопрос, чтобы уточнить причину его возникновения. skm 8 лет назад 0

1 ответ на вопрос

1
talonmies

С целью:

  1. Я не уверен, действительно ли у меня только 2 SM или некоторые из них отключены

    Ваш графический процессор GK107. Он имеет два SMX, каждый с 192 SP. Там нет отключенных процессоров.

  2. Может быть, [sic] есть какой-то способ включить больше SM, и тогда количество SP на SM будет уменьшено.

    Нет волшебного способа изменить кремний в программном обеспечении.

  3. Я все еще путаюсь, что GPU, имеющий более 2 SM (скажем, 8 SM), но меньшее количество SP на SM (384/8 = 48 SP на SM) будет работать так же, как GPU с 2 SM и 192 SP на SM?

    Это огромный вопрос, и я не собираюсь здесь отвечать. NVIDIA выпустила много очень подробных технических описаний по архитектуре и производительности различных поколений своих флагманских компьютерных карт по мере выпуска. Если вы так склонны, я предлагаю прочитать их для себя. Сказав это, эмпирическое правило таково, что в рамках одного поколения архитектурычем больше SM или SMX у устройства, тем лучше оно будет работать при арифметических операциях. Сравнение разных поколений графических процессоров бесполезно. Например, самая первая вычислительная карта Telsa NVIDIA имеет 16 SM (C860). Самый последний имеет 15 SMX (K40). Разница в их максимальной производительности с одинарной точностью составляет примерно 10 раз. Также обратите внимание, что многие приложения реального мира ограничены пропускной способностью памяти, и это может радикально изменить разницу в производительности между различными картами. В то время как количество ядер и пик FLOP более или менее следовали закону Мура, пропускная способность памяти - нет.

Похожие вопросы