Jest oddzielny. Obciążenie teksturą nie przechodzi przez L1. W przypadku aplikacji bez teksturowania (tzn. Nie używasz takich funkcji, jak interpolacja i mocowanie), główną zaletą teksturowania jest to, że pozwala selektywnie dodawać dużą ilość pamięci globalnej, która może być potencjalnie buforowana (zakładając lokalizację i ponowne użycie) bez zakłócania co się dzieje w L1. W przypadku małych zbiorów danych teksturowanie nie daje lepszej precyzji niż L1. W przypadku dużych zestawów danych, gdzie istnieje pewna lokalizacja i ponowne użycie, ale obciążenia z regionu, które są objęte pamięcią podręczną tekstury, mogą w przeciwnym razie spowodować uszkodzenie L1 (które może być tak małe jak 16 KB na SM w Fermi, w zależności od konfiguracji pamięci podręcznej), pamięć podręczna tekstury może zapewnić ogólną korzyść dla aplikacji. Często zdarza się, że użytkownicy używają tekstury, która nie jest tak szybka, jak w przypadku L1, ale może być znacznie szybciej niż w przypadku nieobciążonych ładunków lub rozproszonych ładunków, które powodują uszkodzenie L1. Wiele będzie zależeć od wzorca dostępu i rozmiarów danych. Rozmiar pamięci podręcznej tekstury jest rzędu 8 KB na SM. Możesz buforować znacznie większy region, ale wysoki poziom ponownego użycia i lokalizacji zdecydowanie poprawi wydajność pamięci podręcznej tekstury. Należy również pamiętać, że pamięć tekstur jest tylko do odczytu. Możesz być zainteresowany tym webinar.
Dokładnie odpowiedź, której szukałem, dziękuję. –