С целью:
Я не уверен, действительно ли у меня только 2 SM или некоторые из них отключены
Ваш графический процессор GK107. Он имеет два SMX, каждый с 192 SP. Там нет отключенных процессоров.
Может быть, [sic] есть какой-то способ включить больше SM, и тогда количество SP на SM будет уменьшено.
Нет волшебного способа изменить кремний в программном обеспечении.
Я все еще путаюсь, что GPU, имеющий более 2 SM (скажем, 8 SM), но меньшее количество SP на SM (384/8 = 48 SP на SM) будет работать так же, как GPU с 2 SM и 192 SP на SM?
Это огромный вопрос, и я не собираюсь здесь отвечать. NVIDIA выпустила много очень подробных технических описаний по архитектуре и производительности различных поколений своих флагманских компьютерных карт по мере выпуска. Если вы так склонны, я предлагаю прочитать их для себя. Сказав это, эмпирическое правило таково, что в рамках одного поколения архитектурычем больше SM или SMX у устройства, тем лучше оно будет работать при арифметических операциях. Сравнение разных поколений графических процессоров бесполезно. Например, самая первая вычислительная карта Telsa NVIDIA имеет 16 SM (C860). Самый последний имеет 15 SMX (K40). Разница в их максимальной производительности с одинарной точностью составляет примерно 10 раз. Также обратите внимание, что многие приложения реального мира ограничены пропускной способностью памяти, и это может радикально изменить разницу в производительности между различными картами. В то время как количество ядер и пик FLOP более или менее следовали закону Мура, пропускная способность памяти - нет.