Jestem początkującym początkującym, przeczytałem artykuł o tym temacie (ponieważ używam maszyny kompatybilnej z AVX2).Jak użyć tego makra do sprawdzenia, czy pamięć jest wyrównana?
Teraz, przeczytałem w this pytanie, aby sprawdzić, czy wskaźnik jest wyrównany.
ja sprawdzając je za pomocą tego przykładu zabawek main.cpp
:
#include <iostream>
#include <immintrin.h>
#define is_aligned(POINTER, BYTE_COUNT) \
(((uintptr_t)(const void *)(POINTER)) % (BYTE_COUNT) == 0)
int main()
{
float a[8];
for(int i=0; i<8; i++){
a[i]=i;
}
__m256 evens = _mm256_set_ps(2.0, 4.0, 6.0, 8.0, 10.0, 12.0, 14.0, 16.0);
std::cout<<is_aligned(a, 16)<<" "<<is_aligned(&evens, 16)<<std::endl;
std::cout<<is_aligned(a, 32)<<" "<<is_aligned(&evens, 32)<<std::endl;
}
i skompilować go z icpc -std=c++11 -o main main.cpp
.
Drukowanie otrzymaną mieszaninę:
1 1
1 1
Jednakże, jeśli dodać thhese 3 linie przed 4 drukuje:
for(int i=0; i<8; i++)
std::cout<<a[i]<<" ";
std::cout<<std::endl;
Wynika to:
0 1 2 3 4 5 6 7
1 1
0 1
Szczególnie , Nie rozumiem tego ostatniego 0
. Dlaczego różni się od ostatniego drukowania? czego mi brakuje?
Dzięki za odpowiedź. Tak więc, aby upewnić się, że poprawnie zrozumiałem: wyobraźmy sobie, że możemy reprezentować pamięć jako sąsiednie bloki, z których każdy ma 4 bajty (przestrzeń zajmowana przez zmienną 'float'). Kompilator gwarantuje, że tablica jest wyrównana do tych 4-bajtowych bloków, więc tablica zaczyna się na początku bloku 4-bajtowego. Ale nie ma gwarancji, że tablica zaczyna się na początku tego fragmentu 32-bajtowego fragmentu (8 z tych 4-bajtowych bloków), ale może się zdarzyć przez przypadek. Czy to jest poprawne? – cplusplusuberalles
Jedno dodatkowe pytanie: załóżmy, że mam funkcję, która ma argument "float *" jako argument wejściowy. Nie wiemy, czy jest wyrównany, czy nie. Jak mogę go dopasować? PS: Daj mi znać, czy bardziej odpowiednie jest otworzenie nowego pytania .. – cplusplusuberalles
@plplusplusuberalles 1. Prawidłowo 2. Możesz oczywiście ustawić wskaźnik na inny adres pamięci, który jest wyrównany, ale co byś zrobił z takim wskaźnikiem? Zastanów się analogiczne pytanie: "Mam funkcję, która ma argument wejściowy int. Nie wiemy, czy jest podzielny przez 2. Jak mogę podzielić podzielić przez 2?". Możesz dodać 1, jeśli jest nieparzysty, ale tak jak w przypadku wskaźnika: Jak to jest przydatne? – user2079303