2015-03-05 13 views
14

Czy ktoś może rzucić światło na wyjście z intel_gpu_top? Konkretnie, co jest zadaniem GAM, VS etc (The man page nie jest zbyt pomocne.)Interpretacja wyjścia Intel_gpu_top

Co bitstream zajęty oznacza? Zawsze wydaje się być zerowa ...

   render busy: 45%: █████████        render space: 83/131072 
      bitstream busy: 0%:          bitstream space: 0/131072 
       blitter busy: 0%:          blitter space: 0/131072 

         task percent busy 
         GAM: 43%: ████████▋    vert fetch: 0 (0/sec) 
         VS: 35%: ███████     prim fetch: 0 (0/sec) 
         CL: 33%: ██████▋    VS invocations: 2101845324 (1427552/sec) 
         SF: 33%: ██████▋    GS invocations: 0 (0/sec) 
         VF: 33%: ██████▋     GS prims: 0 (0/sec) 
         GAFS: 33%: ██████▋    CL invocations: 701123988 (475776/sec) 
         SOL: 32%: ██████▌     CL prims: 701708489 (475888/sec) 
         GS: 32%: ██████▌    PS invocations: 1254669239424 (116548992/sec) 
         DS: 32%: ██████▌    PS depth pass: 604287310764 (222384008/sec) 
         TDG: 2%: ▌      
         URBM: 2%: ▌      
         GAFM: 1%: ▎      
         HS: 0%:      
         SVG: 0%:      
         VFE: 0%:      

Odpowiedz

15

Byłem ciekaw, tak więc oto kilka rzeczy mogłem chwycić od reference manuals. Interesujący jest także model intel-gpu-tools source, a zwłaszcza lib/instdone.c, który opisuje, co może pojawić się we wszystkich modelach Intel GPU. This patch był również bardzo pomocny w tłumaczeniu wszystkich tych akronimów!

Niektórzy mogą się mylić, bardzo bym chciał, gdyby ktoś bardziej kompetentny mógł zadzwonić! Wrócę, aby zaktualizować odpowiedź bardziej, gdy się tego nauczę.

pierwsze trzy linie po prawej stronie:

  • czynią przestrzeń jest prawdopodobnie używany przez zwykłych operacji 3D.
  • Sekcja strumienia bitów dotyczy dekodera bitowego strumienia BSD (), który obsługuje przyspieszanie sprzętowe dekodowania mediów. Nie pojawia się jednak na moim GPU (Skylake HD 530), więc może nie być włączony/widoczny wszędzie.
  • Urządzenie do blendingu opisano w obj. 11 i wydaje się odpowiedzialny za akcelerację sprzętową operacji 2D (blitting).

stałe Funkcja (FF) jednostki rurociągów (cechy starej szkoły GPU):

  • VF: wierzchołek moduł pobierania (vol. 1), przy czym pierwsza jednostka FF 3D rurociągu odpowiedzialny za pobieranie dane vertex z pamięci.
  • VS: Moduł cieniujący wierzchołka (vol.1), oblicza obiekty na wierzchołkach każdego prymitywu rysowane przez procesor graficzny. Całkiem standardowa obsługa procesorów graficznych.
  • HS: Hull Shader
  • TE: Teselacja Silnik
  • DS: Domain Shader
  • GS: Geometry Shader
  • Sol: Stream logiczne Wyjście
  • CL : Jednostka klipsa
  • SF: Paski i wentylatory (vol.1), jednostka FF, której główną funkcją jest rozkładanie prymitywnych topologii, takich jak paski i wentylatory, na prymitywy lub obiekty.

Jednostki stosowane do wątku i zarządzania rurociągu, dla obu jednostek FF i GPGPU (zob Intel Open Source HD Graphics Programmers Manual dla partii z informacją o tym, jak to wszystko działa):

  • CS: poleceń Streamer (vol.1), jednostka funkcjonalna silnika przetwarzania graficznego, która pobiera polecenia, analizuje je i kieruje do odpowiedniego potoku.
  • TDG: Dyspozytor Temat
  • VFE: wideo Front-End
  • TSG: Spawner Temat
  • URBM: Unified Powrót bufora Menedżer

Inne rzeczy:

  • GAM: patrz GFX Page Walker (vol. 5), zwany także Arbiterem pamięci, ma związek z tym, w jaki sposób GPU rejestruje strony pamięci, wydaje się dość podobny do tego, co robi TLB (patrz także SLAT) dla twojej pamięci RAM.
  • SDE: South Display Engine; zgodnie z obj. 12, "South Display Engine obsługuje wykrywanie gorącej wtyczki, GPIO, GMBUS, sekwencjonowanie mocy panelu i modulację podświetlenia".
+2

Bitstream jest powiązany z szybką synchronizacją Intela, tj. Sprzętowym dekoderem/koderem dla wideo. Czemu? Na mojej karcie HD3000 (dostarczanej z i3-3217U), korzystającej z najnowszej wtyczki ffmpeg (3.4.2, VAAPI umożliwiającej korzystanie z szybkiej synchronizacji Intela), podczas testowania dekodowania wideo Hp4 1080p z procesorem wynosi ona około 180 fps, "bitstream" jest liczbą bardzo niskie, a użycie procesora wynosi prawie 100% na wszystkich rdzeniach. Po przełączeniu na dekoder sprzętowy GPU, liczba klatek na sekundę wyniesie około 350, liczba bitów wzrośnie, ale użycie procesora jest dość niskie. –

+0

Ah, dzięki! Udało mi się znaleźć więcej informacji na ten temat po tym, jak uświadomiłem sobie, że nie obsługuje on tylko dźwięku. Zaktualizowałem odpowiedź! –

Powiązane problemy