2012-07-09 22 views
9

Zarówno w MATLAB, jak i Numpy, tablice mogą być indeksowane za pomocą tablic. Jednak zachowanie jest inne. Pozwól mi wyjaśnić to na przykładzie.Indeksowanie tablic podobnych do MATLAB z Numpy

MATLAB:

>> A = rand(5,5) 

A = 

    0.1622 0.6020 0.4505 0.8258 0.1067 
    0.7943 0.2630 0.0838 0.5383 0.9619 
    0.3112 0.6541 0.2290 0.9961 0.0046 
    0.5285 0.6892 0.9133 0.0782 0.7749 
    0.1656 0.7482 0.1524 0.4427 0.8173 

>> A([1,3,5],[1,3,5]) 

ans = 

    0.1622 0.4505 0.1067 
    0.3112 0.2290 0.0046 
    0.1656 0.1524 0.8173 

Numpy:

In [2]: A = arange(25).reshape((5,5)) 

In [3]: A 
Out[3]: 
array([[ 0, 1, 2, 3, 4], 
     [ 5, 6, 7, 8, 9], 
     [10, 11, 12, 13, 14], 
     [15, 16, 17, 18, 19], 
     [20, 21, 22, 23, 24]]) 

In [6]: A[[0,2,4], [0,2,4]] 
Out[6]: array([ 0, 12, 24]) 

Słownie: MATLAB wybiera wiersze i kolumny, NumPy "zamki" dwie tablice indeksów i używa krotki aby wskazać wpisów.

Jak mogę uzyskać zachowanie MATLAB przy pomocy Numpy?

Odpowiedz

7

Można to zrobić:

A[[0,2,4],:][:,[0,2,4]] 

które dadzą wynik MATLAB-jak chcesz.

Warto mieć świadomość, że raczej niekonsekwentnie, jeśli używasz plastrów do indeksowania następnie dostać MATLAB-podobne rezultaty bez takich hackery:

>>> A[1:3,1:3] 
array([[ 6, 7], 
     [11,12]]) 

W numpy, w przeciwieństwie do MATLAB, 1:3 nie jest po prostu skrótem dla [1,2] lub czymkolwiek podobnym. (W tym momencie czuję się w obowiązku wspomnieć coś już na pewno wie, a mianowicie, że Pythona 1:3 jest trochę jak [1,2] natomiast MATLAB jest trochę jak [1,2,3]. Punkt końcowy prawy jest zawarty w programie MATLAB i wyłączone w Pythonie)

+3

To jest całkiem nieefektywne. Wymaga to utworzenia tymczasowej tablicy w pamięci, która może być dość duża w zależności od rozmiaru tablic, z którymi pracujesz. Istnieje kilka bardziej wydajnych sposobów, aby to zrobić, w tym za pomocą funkcji ix_ helper. –

+2

Tak, wszystko w porządku. Z drugiej strony rzecz zbudowana przez 'ix_' jest również dość duża, aczkolwiek tymczasowa. Wykonałem eksperymenty czasowe dla tablicy 5x5, jak w oryginalnym pytaniu, z następującymi wynikami. '[,:] [:,]' jest o około 25% szybsze niż '[ix _()]', ale jeśli używasz tych samych indeksów za każdym razem, budując tablicę indeksowania * raz * z 'ix_' i używaj jej ponownie jest około 10 razy szybsza - choć oczywiście wtedy płacisz koszt użycia pamięci. –

+2

np.ix_, w większości przypadków używa tylko trywialnej ilości pamięci, ponieważ zwraca poglądy na jej argumenty. Również np.ix_ jest operacją czasu stałego, podczas gdy A [I1,:] [:, I2] wynosi ~ n^2 zarówno w czasie, jak iw użyciu pamięci. Ale jeśli naprawdę potrzebujesz 25% zwiększenia wydajności w macierzy 5x5, musisz zrobić to, co masz do zrobienia. –

14

Ty można używać funkcji pomocnika numpy.ix_ aby uzyskać zachowanie Matlab:

from numpy import ix_ 
A[ ix_([0,2,4], [0,2,4]) ] 
1

skuteczne sposób to zrobić z numpy jest zmienią swoją tablicę indeksu pasujące osie są indeksowania tj

In [103]: a=numpy.arange(100).reshape(10,10) 

In [104]: a 
Out[104]: 
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9], 
    [10, 11, 12, 13, 14, 15, 16, 17, 18, 19], 
    [20, 21, 22, 23, 24, 25, 26, 27, 28, 29], 
    [30, 31, 32, 33, 34, 35, 36, 37, 38, 39], 
    [40, 41, 42, 43, 44, 45, 46, 47, 48, 49], 
    [50, 51, 52, 53, 54, 55, 56, 57, 58, 59], 
    [60, 61, 62, 63, 64, 65, 66, 67, 68, 69], 
    [70, 71, 72, 73, 74, 75, 76, 77, 78, 79], 
    [80, 81, 82, 83, 84, 85, 86, 87, 88, 89], 
    [90, 91, 92, 93, 94, 95, 96, 97, 98, 99]]) 

In [105]: x=numpy.array([3,6,9]) 

In [106]: y=numpy.array([2,7,8]) 

In [107]: a[x[:,numpy.newaxis],y[numpy.newaxis,:]] 
Out[107]: 
array([[32, 37, 38], 
     [62, 67, 68], 
     [92, 97, 98]]) 

zasady NumPy za nadawania są twoim przyjacielem (i tak dużo lepiej niż Matlab) ...

HTH

Powiązane problemy