XvBA является эквивалентом VDPAU от ATI. Применяются те же ограничения: не все медиаплееры будут использовать ускорение (libVA).
См. Stream SDK для поддержки OpenCL. Я не играл с этим, но общее ощущение, что CUDA сейчас более зрелый, чем OpenCL для GPGPU (хотя, естественно, ограничен тем, что не является независимым от производителя стандартом). С другой стороны, как вы говорите, у ATI сейчас есть преимущество в производительности.
Я не видел карту серии 58xx, оснащенную только 512 МБ ОЗУ.