2014-07-22 16 views
6

Mam następującą tablicęZnalezienie kolejnych zer w numpy tablicy

a = [1, 2, 3, 0, 0, 0, 0, 0, 0, 4, 5, 6, 0, 0, 0, 0, 9, 8, 7,0,10,11] 

Co chciałbym znaleźć początek i wskaźnik końca tablicy, gdzie wartości są zerami kolejno na tablicy powyżej Dane wyjściowe wygląda następująco:

[3,8],[12,15],[19] 

Chcę zrobić to tak wydajnie, jak to możliwe.

+0

Dlaczego w dół głos, proszę napisać odpowiedź – Shan

+2

To nie byłem ja, ale to jest tradycyjne, aby powiedzieć coś w stylu "Mam ten kod" (i pokazać) i to nie działa. Nie pokazałeś, co próbowałeś. – doctorlove

+0

cóż, mogę po prostu przejrzeć tablicę z pętlą i oznaczyć wskaźniki początkowe i końcowe, myślę, że ludzie, którzy znają pythona, zrozumieją to łatwo – Shan

Odpowiedz

11

Oto dość zwarty realizacja wektorowy. Zmieniłem nieco wymagania, więc wartość zwracana jest nieco bardziej "numpythonic": tworzy tablicę o kształcie (m, 2), gdzie m jest liczbą "przebiegów" zer. Pierwsza kolumna to indeks pierwszych 0 w każdym przebiegu, a drugi to indeks pierwszego niezerowego elementu po biegu. (Pasuje ten wzorzec indeksowania, na przykład, jak krojenie działa i jak funkcja range działa.)

import numpy as np 

def zero_runs(a): 
    # Create an array that is 1 where a is 0, and pad each end with an extra 0. 
    iszero = np.concatenate(([0], np.equal(a, 0).view(np.int8), [0])) 
    absdiff = np.abs(np.diff(iszero)) 
    # Runs start and end where absdiff is 1. 
    ranges = np.where(absdiff == 1)[0].reshape(-1, 2) 
    return ranges 

Na przykład:

In [236]: a = [1, 2, 3, 0, 0, 0, 0, 0, 0, 4, 5, 6, 0, 0, 0, 0, 9, 8, 7, 0, 10, 11] 

In [237]: runs = zero_runs(a) 

In [238]: runs 
Out[238]: 
array([[ 3, 9], 
     [12, 16], 
     [19, 20]]) 

Z tym formacie, to jest proste, aby uzyskać liczbę zer w każdym biegu:

In [239]: runs[:,1] - runs[:,0] 
Out[239]: array([6, 4, 1]) 

To zawsze dobry pomysł, aby sprawdzić przypadki krawędzi:

In [240]: zero_runs([0,1,2]) 
Out[240]: array([[0, 1]]) 

In [241]: zero_runs([1,2,0]) 
Out[241]: array([[2, 3]]) 

In [242]: zero_runs([1,2,3]) 
Out[242]: array([], shape=(0, 2), dtype=int64) 

In [243]: zero_runs([0,0,0]) 
Out[243]: array([[0, 3]]) 
+0

w jakiś sposób to zrobić z pandami? – toine

1

Możesz użyć itertools, aby osiągnąć oczekiwany rezultat.

from itertools import groupby 
a= [1, 2, 3, 0, 0, 0, 0, 0, 0, 4, 5, 6, 0, 0, 0, 0, 9, 8, 7,0,10,11] 
b = range(len(a)) 
for group in groupby(iter(b), lambda x: a[x]): 
    if group[0]==0: 
     lis=list(group[1]) 
     print [min(lis),max(lis)] 
+0

To zwróci '[19, 19]', myślę, że OP oczekuje właśnie [19]. I zamiast tworzyć niepotrzebną listę 'b', spróbuj użyć' wyliczyć (a). ' –

0

Oto funkcja zwyczaj, nie wiem, najbardziej efektywne, ale działa:

def getZeroIndexes(li): 
    begin = 0 
    end = 0 
    indexes = [] 
    zero = False 
    for ind,elt in enumerate(li): 
    if not elt and not zero: 
     begin = ind 
     zero = True 
    if not elt and zero: 
     end = ind 
    if elt and zero: 
     zero = False 
     if begin == end: 
     indexes.append(begin) 
     else: 
     indexes.append((begin, end)) 

    return indexes 
Powiązane problemy