2009-05-18 21 views
35

Mam 2d tablicy, która wygląda tak:Jaki jest najprostszy sposób na rozszerzenie tablicy numpy w 2 wymiarach?

XX 
xx 

Co znajduje się w najbardziej efektywny sposób, aby dodać dodatkowy wiersz i kolumnę:

xxy 
xxy 
yyy 

Dla punkty bonusowe, chciałbym być również jestem w stanie znokautować pojedyncze wiersze i kolumny, więc na przykład w macierzy poniżej chciałbym móc znokautować wszystkie a, pozostawiając tylko litery x - konkretnie próbuję usunąć n-ty wiersz i n-tą kolumnę w w tym samym czasie - i chcę móc to zrobić tak szybko, jak to możliwe:

xxaxx 
xxaxx 
aaaaa 
xxaxx 
xxaxx 

Odpowiedz

43

Najkrótszy pod względem linii kodu, jaki mogę wymyślić, dotyczy pierwszego pytania.

>>> import numpy as np 
>>> p = np.array([[1,2],[3,4]]) 

>>> p = np.append(p, [[5,6]], 0) 
>>> p = np.append(p, [[7],[8],[9]],1) 

>>> p 
array([[1, 2, 7], 
    [3, 4, 8], 
    [5, 6, 9]]) 

A na drugie pytanie

p = np.array(range(20)) 
>>> p.shape = (4,5) 
>>> p 
array([[ 0, 1, 2, 3, 4], 
     [ 5, 6, 7, 8, 9], 
     [10, 11, 12, 13, 14], 
     [15, 16, 17, 18, 19]]) 
>>> n = 2 
>>> p = np.append(p[:n],p[n+1:],0) 
>>> p = np.append(p[...,:n],p[...,n+1:],1) 
>>> p 
array([[ 0, 1, 3, 4], 
     [ 5, 6, 8, 9], 
     [15, 16, 18, 19]]) 
+0

'np.append' jest jedną z najczęściej wykorzystywanych funkcji w' numpy'. Najczęściej ludzie zakładają, że jest tak, jak dołącza lista. Jeśli musisz dołączyć do tablic, naucz się używać 'np.concatenate' bezpośrednio (nawet jeśli jest wybredny w kwestii wymiarów i kształtów). – hpaulj

33

Użyteczna alternatywa odpowiedź na pierwsze pytanie, wykorzystując przykłady z tomeedee za odpowiedź, byłoby wykorzystanie NumPy za vstack i column_stack method:

Biorąc pod uwagę macierz p,

>>> import numpy as np 
>>> p = np.array([ [1,2] , [3,4] ]) 

w zwiększonym matrycy może być wytwarzany przez:

>>> p = np.vstack([ p , [5 , 6] ]) 
>>> p = np.column_stack([ p , [ 7 , 8 , 9 ] ]) 
>>> p 
array([[1, 2, 7], 
     [3, 4, 8], 
     [5, 6, 9]]) 

Metody te mogą być korzystne w praktyce niż NP.dołączania(), ponieważ pozwalają one na tablice 1D być dołączone do matrycy bez zmiany, w przeciwieństwie do następujących scenariuszy:

>>> p = np.array([ [ 1 , 2 ] , [ 3 , 4 ] , [ 5 , 6 ] ]) 
>>> p = np.append(p , [ 7 , 8 , 9 ] , 1) 
Traceback (most recent call last): 
    File "<stdin>", line 1, in <module> 
    File "/usr/lib/python2.6/dist-packages/numpy/lib/function_base.py", line 3234, in append 
    return concatenate((arr, values), axis=axis) 
ValueError: arrays must have same number of dimensions 

W odpowiedzi na pytanie drugie dobry sposób usunąć wierszy i kolumn jest użyciu logicznej tablicy indeksowania, co następuje:

Biorąc pod uwagę macierz p

>>> p = np.arange(20).reshape((4 , 5)) 

przypuśćmy, że chcemy usunąć wiersz 1 i kolumny 2:

>>> r , c = 1 , 2 
>>> p = p [ np.arange(p.shape[0]) != r , : ] 
>>> p = p [ : , np.arange(p.shape[1]) != c ] 
>>> p 
array([[ 0, 1, 3, 4], 
     [10, 11, 13, 14], 
     [15, 16, 18, 19]]) 

Uwaga - dla zreformowanych użytkowników Matlab - jeśli chciał zrobić to w jednej wkładki trzeba indeksu dwukrotnie:

>>> p = np.arange(20).reshape((4 , 5))  
>>> p = p [ np.arange(p.shape[0]) != r , : ] [ : , np.arange(p.shape[1]) != c ] 

Technika ta może również zostać przedłużony do usunięcia zestawy wierszy i kolumny, więc jeśli chcemy usunąć wiersze 0 & 2 i kolumnach 1, 2 & 3 moglibyśmy użyć numpy na setdiff1d funkcję wygenerować żądany indeks logiczne:

>>> p = np.arange(20).reshape((4 , 5)) 
>>> r = [ 0 , 2 ] 
>>> c = [ 1 , 2 , 3 ] 
>>> p = p [ np.setdiff1d(np.arange(p.shape[0]), r) , : ] 
>>> p = p [ : , np.setdiff1d(np.arange(p.shape[1]) , c) ] 
>>> p 
array([[ 5, 9], 
     [15, 19]]) 
4

uważam, że o wiele łatwiej "przedłużyć" poprzez przypisanie w większej matrycy. Na przykład.

import numpy as np 
p = np.array([[1,2], [3,4]]) 
g = np.array(range(20)) 
g.shape = (4,5) 
g[0:2, 0:2] = p 

Oto tablic:

p

array([[1, 2], 
     [3, 4]]) 

g:

array([[ 0, 1, 2, 3, 4], 
     [ 5, 6, 7, 8, 9], 
     [10, 11, 12, 13, 14], 
     [15, 16, 17, 18, 19]]) 

i otrzymaną g po przydzieleniu:

array([[ 1, 2, 2, 3, 4], 
     [ 3, 4, 7, 8, 9], 
     [10, 11, 12, 13, 14], 
     [15, 16, 17, 18, 19]]) 
0

Może potrzebujesz tego.

>>> x = np.array([11,22]) 
>>> y = np.array([18,7,6]) 
>>> z = np.array([1,3,5]) 
>>> np.concatenate((x,y,z)) 
array([11, 22, 18, 7, 6, 1, 3, 5]) 
7

Innym eleganckie rozwiązanie do pierwsze pytanie może być komenda insert:

p = np.array([[1,2],[3,4]]) 
p = np.insert(p, 2, values=0, axis=1) # insert values before column 2 

prowadzi do:

array([[1, 2, 0], 
     [3, 4, 0]]) 

insert może być wolniejsze niż append ale pozwala na wypełnienie cały wiersz/kolumnę z jedną wartością łatwo.

chodzi o drugie pytanie, delete sugerowano wcześniej:

p = np.delete(p, 2, axis=1) 

który przywraca oryginalną tablicę jeszcze:

array([[1, 2], 
     [3, 4]]) 
1

można użyć:

>>> np.concatenate([array1, array2, ...]) 

na przykład

>>> import numpy as np 
>>> a = [[1, 2, 3],[10, 20, 30]] 
>>> b = [[100,200,300]] 
>>> a = np.array(a) # not necessary, but numpy objects prefered to built-in 
>>> b = np.array(b) # "^ 
>>> a 
array([[ 1, 2, 3], 
     [10, 20, 30]]) 
>>> b 
array([[100, 200, 300]]) 
>>> c = np.concatenate([a,b]) 
>>> c 
array([[ 1, 2, 3], 
     [ 10, 20, 30], 
     [100, 200, 300]]) 
>>> print c 
[[ 1 2 3] 
[ 10 20 30] 
[100 200 300]] 

~ - + - ~ - + - ~ - + - ~

Czasami można natknąć kłopoty, jeśli tablica numpy obiekt jest inicjowany z niekompletnymi wartościami dla jego właściwości kształtu. Ten problem rozwiązuje się, przypisując do właściwości shape krotkę: (array_length, element_length).

Uwaga: W tym przypadku 'array_length' i 'element_length' są liczbami całkowitymi, które zastępujesz wartościami dla. "Krotka" to po prostu para cyfr w nawiasach.

np.

>>> import numpy as np 
>>> a = np.array([[1,2,3],[10,20,30]]) 
>>> b = np.array([100,200,300]) # initialize b with incorrect dimensions 
>>> a.shape 
(2, 3) 
>>> b.shape 
(3,) 
>>> c = np.concatenate([a,b]) 

Traceback (most recent call last): 
    File "<pyshell#191>", line 1, in <module> 
    c = np.concatenate([a,b]) 
ValueError: all the input arrays must have same number of dimensions 
>>> b.shape = (1,3) 
>>> c = np.concatenate([a,b]) 
>>> c 
array([[ 1, 2, 3], 
     [ 10, 20, 30], 
     [100, 200, 300]]) 
Powiązane problemy