Pracuję nad procesorem Nehalam/Westmere Intel Micro Architecture. Chcę zoptymalizować mój kod dla tej architektury. Czy istnieją jakieś specjalne flagi kompilacji lub funkcje C GCC, które pomogą mi poprawić wydajność pracy mojego kodu?Opcje GCC do optymalizacji dla danej architektury procesora
Już używam -o3.
Language of the Code - C
Platform - Linux
GCC Version - 4.4.6 20110731 (Red Hat 4.4.6-3) (GCC)
W moim kodzie mam porównanie zmiennoprzecinkowe i wykonano je ponad milion razy.
Załóżmy, że kod jest już najlepiej zoptymalizowany.
Co w tym złego wyniki można uzyskać, patrząc na dokumentacji i Googling? – jthill
http://gcc.gnu.org/onlinedocs/gcc/Option-Summary.html – Jay
@jthill nie był w stanie uzyskać żadnej rzeczy dla tej architektury perticular .. więc zastanawiałem się, czy mamy coś konkretnego, jak kompilatory intel –