Po raz pierwszy pracuję z wewnętrzną implementacją SSE. Próbuję przekonwertować prosty fragment kodu na szybszą wersję, używając Intel SSE intrinsic (upto SSE4.2). Wydaje mi się, że napotykam wiele bł
Wprowadzam szybką funkcję konwersji x888 -> 565 pikseli w pixman zgodnie z algorytmem opisanym jako by Intel [pdf]. Ich kod konwertuje x888 -> 555, podczas gdy ja chcę przekonwertować na 565. Niestety
Potrzebuję szybko porównać dwa ciągi na maszynie z obsługą SSE4. Jak mogę to zrobić bez pisania wstawek asemblera? Niektóre opakowania takie jak long long bitmask = strcmp(char* a, char* b) będą ideal