simd

    12Ciepło

    3Odpowiedz

    Mam zapakowany wektor czterech 64-bitowych wartości zmiennoprzecinkowych. Chciałbym uzyskać sumę elementów wektora. Z SSE (i przy użyciu 32-bitowych pływaków) może po prostu wykonaj następujące czynno

    17Ciepło

    4Odpowiedz

    Podczas korzystania z instrukcji SSE2, takich jak PADDD (tj. Wewnętrznie _mm_add_epi32), istnieje sposób sprawdzenia, czy któraś z operacji została przepełniona? Pomyślałem, że być może flaga w rejest

    10Ciepło

    3Odpowiedz

    Mam wektor __m256d z czterema 64-bitowymi wartościami zmiennoprzecinkowymi. Potrzebuję znaleźć poziomą wartość maksymalną elementów wektora i zapisać wynik w podwójnej precyzji wartości skalarnej; Wsz

    5Ciepło

    1Odpowiedz

    Zajrzałem do google i stack over flow i przeczytać wszystkie posty dotyczące tego, jak uzyskać InternalsVisibleTo do pracy. Ale to nie działa dla mnie. Prosimy nie głosować na dół na to pytanie, ponie

    10Ciepło

    1Odpowiedz

    Mam dużą funkcję przetwarzania pikseli, którą obecnie próbuję optymalizować za pomocą funkcji wewnętrznych. Będąc nowicjuszem SSE, nie jestem pewien, jak poradzić sobie z częścią kodu, która wymaga ta

    11Ciepło

    1Odpowiedz

    Chciałbym, aby zespół QA mógł uruchomić testy SpecFlow. Chciałbym, aby mogli zmieniać wartości i dodawać więcej scenariuszy. Te dołączone scenariusze będą miały zgodne definicje kroków, więc będą musi

    14Ciepło

    3Odpowiedz

    Jaka jest implementacja GCC (4.6+) __builtin_clz? Czy odpowiada niektórym instrukcjom procesora w Intel x86_64 (AVX)?

    12Ciepło

    1Odpowiedz

    Czy istnieje sposób na wypychanie spakowanej liczby podwójnej z rejestru XMM do stosu? a potem w razie potrzeby wyskakuje z powrotem? Idealnie szukam czegoś podobnego PUSH lub POP dla rejestrów ogólne

    6Ciepło

    1Odpowiedz

    Uczę się korzystać z możliwości SIMD, ponownie pisząc moją osobistą bibliotekę przetwarzania obrazów, używając wektorów wewnętrznych. Jedną z podstawowych funkcji jest proste "array +=", czyli void ar

    10Ciepło

    2Odpowiedz

    Czy istnieje sposób sprawdzenia, czy wszystkie bity/bajty/słowa itp. W zmiennej __m128i mają wartość 0? W mojej aplikacji muszę sprawdzić, czy wszystkie liczby całkowite spakowane w zmiennej __m128i s