Jak mogę obliczyć FLOPS mojej aplikacji? Jeśli mam całkowitą liczbę wykonanych instrukcji, mogę podzielić ją przez czas wykonania. Ale jak policzyć liczbę wykonanych instrukcji?Obliczanie FLOPS (operacje zmiennoprzecinkowe na sekundę)
Moje pytanie jest ogólne, a odpowiedź na każdy język jest bardzo cenna. Ale szukam rozwiązania dla mojej aplikacji, która jest rozwijana przez C/C++ i CUDA.
Nie wiem, czy tagi są prawidłowe, popraw mnie, jeśli się mylę.
prawdopodobny duplikat [Jak obliczyć Gflops z jądra] (http://stackoverflow.com/questions/7875607/how-to-calculate-gflops-of-a-ernel) – talonmies
Znam to pytanie! Moje pytanie jest ogólne. Jak obliczyć FLOPS? Nawet wielordzeniowe. Odpowiedź może również pomóc w mojej sprawie "CUDA". – ahmad
Opublikowaliśmy, w jaki sposób narzędzia NVIDIA mogą być używane do zbierania FLOPów w [Obliczanie osiągniętej przepustowości i FLOPS ...] (http://stackoverflow.com/questions/12539300/calculating-achieved-bandwidth-and-flops-gflops-and -valuate-cuda-kernel-perfor). Dla x86 istnieje kilka bibliotek Linuksa do obliczania FLOPów. Monitor wydajności x86 obsługuje zliczanie FLOP, ale musisz przeczytać instrukcję, aby zrozumieć szczegóły (instrukcje spekulacyjne, co się liczy, ...) –