Czy jest jakiś sposób na urządzeniach CUDA 2.0 wyłączających pamięć podręczną L1 tylko dla jednej konkretnej zmiennej? Wiem, że można wyłączyć pamięć podręczną L1 podczas kompilacji, dodając flagę -Xptxas -dlcm=cg
do nvcc
dla wszystkich operacji związanych z pamięcią. Jednak chcę wyłączyć pamięć podręczną tylko dla odczytów pamięci dla określonej zmiennej globalnej, tak aby cała reszta pamięci była czytana, aby przejść przez pamięć podręczną L1.CUDA wyłącza pamięć podręczną L1 tylko dla jednej zmiennej
Na podstawie wyszukiwania, które przeprowadziłem w Internecie, możliwe jest rozwiązanie poprzez kod zespołu PTX.
Dzięki! To działa świetnie! – zeus2
@Reguj, czy nigdzie nie są dostarczane przez nagłówki NVIDIA? – einpoklum
[this] (https://nvlabs.github.io/cub/classcub_1_1_cache_modified_input_iterator.html#details) może być interesujące –