W "CUDA C Programming Guide 5.0", p73 mówi: "Dowolny adres zmiennej rezydującej w pamięci globalnej lub zwracanej przez jedną z procedur alokacji pamięci sterownika lub interfejsu API środowiska wykonawczego jest zawsze wyrównany do co najmniej 256 bajtów". Nie znam dokładnego znaczenia tego zdania. Czy ktoś może pokazać mi przykład? Wielkie dzięki.Wyrównanie cuda 256 bajtów na poważnie?
Pytanie pochodne: A co z przydziałem jednowymiarowej tablicy podstawowych elementów (takich jak int) lub własnych? Adres początkowy tablicy będzie wielokrotnością 256B, podczas gdy adres każdego elementu w tablicy niekoniecznie będzie wielokrotnością 256B?
Adres początkowy każdego cudaMalloc będzie wielokrotnością 256. 256 jest dwoma symbolami w hex, będą one równe zero w addrexx; więc możesz uzyskać adres taki jak 0x0456ad00, ale nie 0x0456ad80. – osgx