zawsze można użyć np.einsum:
>>> a = np.arange(11*5*5).reshape(11,5,5)
>>> np.einsum('...ijk->...i',a)/(a.shape[-1]*a.shape[-2])
array([ 12, 37, 62, 87, 112, 137, 162, 187, 212, 237, 262])
Works na wyższych tablic wymiarowych (wszystkie z tych metod byłoby gdyby etykiety osi są zmienione):
>>> a = np.arange(10*11*5*5).reshape(10,11,5,5)
>>> (np.einsum('...ijk->...i',a)/(a.shape[-1]*a.shape[-2])).shape
(10, 11)
Szybciej do bagażnika:
a = np.arange(11*5*5).reshape(11,5,5)
%timeit a.reshape(11, 25).mean(axis=1)
10000 loops, best of 3: 21.4 us per loop
%timeit a.mean(axis=(1,2))
10000 loops, best of 3: 19.4 us per loop
%timeit np.einsum('...ijk->...i',a)/(a.shape[-1]*a.shape[-2])
100000 loops, best of 3: 8.26 us per loop
Skaluje się nieco lepiej niż inne metody w miarę wzrostu rozmiaru tablicy.
Korzystanie dtype=np.float64
ma znacznie nie zmieni powyższe czasy, więc po prostu do podwójnego sprawdzenia:
a = np.arange(110*50*50,dtype=np.float64).reshape(110,50,50)
%timeit a.reshape(110,2500).mean(axis=1)
1000 loops, best of 3: 307 us per loop
%timeit a.mean(axis=(1,2))
1000 loops, best of 3: 308 us per loop
%timeit np.einsum('...ijk->...i',a)/(a.shape[-1]*a.shape[-2])
10000 loops, best of 3: 145 us per loop
również coś, co jest ciekawe:
%timeit np.sum(a) #37812362500.0
100000 loops, best of 3: 293 us per loop
%timeit np.einsum('ijk->',a) #37812362500.0
100000 loops, best of 3: 144 us per loop
To działa? Można by tak myśleć o 1.7 i później, ale doktorzy wciąż mówią tylko jedną oś. – Jaime
Nie myślałem o wersji numpy, mam 1.7.1 i działa. Nie ma go w dokumentacji, ale dziennik zmian mówi o ufuncs: http://www.softpedia.com/progChangelog/Numpy-Changelog-103892.html –
Fajnie, nie wiedziałem, że to zostało dodane! – lmjohns3