2012-12-27 20 views
5
float a[4] = {1,2,3,4}, b[4] = {4,3,2,1}; 
uint32_t c[4]; 

int main() { 

    __m128 pa = _mm_loadu_ps(a); 

    __m128 pb = _mm_loadu_ps(b); 
    __m128 pc = _mm_cmpgt_ps(pa, pb); 
    _mm_storeu_ps((float*)c, pc); 
    for (int i = 0;i < 4; ++i) printf("%u\n", c[i]); 
    return 0; 
} 

jaka jest właściwa instrukcja _mm_storeu_ps((float*)c, pc)? tutaj, c jest tablicą całkowitą ... Nie sądzę, że ten sposób jest dobry, lepiej?jak odwrócić __m128 w ints

+0

Moje oczy ... bolały ... Ostatni raz sprawdziłem, że abominacja '__m128' nie była w standardzie C++. –

Odpowiedz

7

Istnieją dwie instrukcje do konwersji __m128 (float wektor) w __m128i (int32_t wektora) w SSE2: _mm_cvtps_epi32 (z zaokrągleniem) i _mm_cvttps_epi32 (z obcinania).

__m128i vi = _mm_cvttps_epi32(pc); 
_mm_storeu_si128((__m128i *)c, vi); 

Jeśli nie można używać SSE2, należy przekonwertować float tablica do int tablica po zapisaniu pc do float tablicy.

float d[4]; 
_mm_storeu_ps(d, pc); 
c[0] = (int)d[0]; c[1] = (int)d[1]; c[2] = (int)d[2]; c[3] = (int)d[3];