Szybkość transmisji danych w operacjach cudaMemcpy
jest silnie uzależniona od liczby pasów PCI-e 3.0 (lub 2.0) przydzielonych do uruchomienia z procesora na GPU. Ciekawi mnie sposób wykorzystania pasów PCI-e na urządzeniach Nvidii zawierających dwa procesory graficzne.Alokacja linii PCI-e na kartach 2-GPU?
Nvidia ma kilka produktów, które mają dwa procesory graficzne na jednym urządzeniu PCI-e. Na przykład:
- GTX 590 zawiera dwa układy GPU Fermi GF110
- GTX 690 zawiera dwa układy GPU Kepler GK104
Jak wiele nowszych kart graficznych, urządzenia te zamontować w PCI-e 16
gniazd. W przypadku kart zawierających tylko jeden procesor GPU, GPU może wykorzystywać 16 pasów PCI-e.
Jeśli mam urządzenie zawierające dwa procesory graficzne (jak GTX 690), ale używam tylko zadania obliczeniowe na tylko jeden z GPU, może wszystkie pasy 16 PCI-E służyć jeden GPU że jest używany?
Aby pokazać jak ten ASCII techniki ...
[ GTX690 (2x GF110) ] ------ 16 linii PCI-e ----- [ CPU ]
mam nie mówić o przypadku gdzie procesor jest podłączony do dwóch kart, które mają po jednym GPU. (Jak na poniższym schemacie)
[ GTX670 (1x GK104) ] ------ linii PCI-e ----- [ procesora ] ------ PCI -e pasy ----- [ GTX670 (1x GK104) ]