2010-03-02 19 views
39

Mam listę zawierającą dane, takie jak:Wykrywanie kolejnych liczb całkowitych w postaci listy

[1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14] 

chciałbym wydrukować zakresach kolejnych liczb całkowitych:

1-4, 7-8, 10-14 

Czy istnieje wbudowana w/szybki/skuteczny sposób robienia tego?

+0

Zobacz http://stackoverflow.com/questions/2154249/identify-groups-of-continuous-numbers-in-a-list, co wskazuje na http: // docs. python.org/library/itertools.html#examples –

+1

Praca domowa? Pokazujesz nam, co próbujesz, a my zobaczymy, czy możemy zrobić coś lepiej. –

+0

Dziękuję, powinienem był znaleźć to przed pytaniem:/ – James

Odpowiedz

62

Od the docs:

>>> from itertools import groupby 
>>> from operator import itemgetter 
>>> data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28] 
>>> for k, g in groupby(enumerate(data), lambda (i, x): i-x): 
...  print map(itemgetter(1), g) 
... 
[1] 
[4, 5, 6] 
[10] 
[15, 16, 17, 18] 
[22] 
[25, 26, 27, 28] 

można dostosować to dość łatwo dostać drukowany zbiór zakresów.

+0

Nie zapomnij o "zaimportowaniu itertools". Działa to również tylko z Pythonem w wersji 2.4 i nowszych. – Gabe

+1

w rzeczywistości będziesz potrzebować 'from itertools import *' i 'from operator import *' (lub odpowiednika), przynajmniej w Pythonie 2.6. –

+18

Nie używaj importów gwiazd! ** Nigdy ** używać importów gwiazd! Zamiast tego użyj 'from itertools import groupby' i' from operator import itemgetter'. –

3

Wbudowany: Nie, o ile wiem.

Musisz przejść przez tablicę. Zacznij od umieszczenia pierwszej wartości w zmiennej i wydrukuj ją, a następnie tak długo, jak długo będziesz uderzać w kolejny numer, pamiętaj tylko o ostatniej liczbie w innej zmiennej. Jeśli następny numer nie jest zgodny, sprawdź ostatni zapamiętany numer w stosunku do pierwszego numeru. Jeśli to jest to samo, nie rób nic. Jeśli jest inny, wypisz "-" i ostatni numer. Następnie wprowadź aktualną wartość do pierwszej zmiennej i rozpocznij od nowa. Na końcu tablicy działa się tak samo, jak w przypadku trafienia numeru poza linię.

mogłem napisany kod, oczywiście, ale nie chcę psuć swoje zadanie domowe :-)

1

To wydrukować dokładnie tak, jak podano:

>>> nums = [1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14] 
>>> ranges = sum((list(t) for t in zip(nums, nums[1:]) if t[0]+1 != t[1]), []) 
>>> iranges = iter(nums[0:1] + ranges + nums[-1:]) 
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges]) 
1-4, 7-8, 10-14 

Jeśli lista ma każda pojedyncza liczba waha się, zostaną one pokazane jako nn:

>>> nums = [1, 2, 3, 4, 5, 7, 8, 9, 12, 15, 16, 17, 18] 
>>> ranges = sum((list(t) for t in zip(nums, nums[1:]) if t[0]+1 != t[1]), []) 
>>> iranges = iter(nums[0:1] + ranges + nums[-1:]) 
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges]) 
1-5, 7-9, 12-12, 15-18 
0

Oto kolejny podstawowe rozwiązanie bez użycia moduł, który jest dobry dla wywiadu, na ogół w wywiadzie poprosili bez USI NG jakieś moduły:

#!/usr/bin/python 

def split_list(n): 
    """will return the list index""" 
    return [(x+1) for x,y in zip(n, n[1:]) if y-x != 1] 

def get_sub_list(my_list): 
    """will split the list base on the index""" 
    my_index = split_list(my_list) 
    output = list() 
    prev = 0 
    for index in my_index: 
     new_list = [ x for x in my_list[prev:] if x < index] 
     output.append(new_list) 
     prev += len(new_list) 
    output.append([ x for x in my_list[prev:]]) 
    return output 

my_list = [1, 3, 4, 7, 8, 10, 11, 13, 14] 
print get_sub_list(my_list) 

wyjściowa:

[[1], [3, 4], [7, 8], [10, 11], [13, 14]] 
0

miałem podobny problem i używam następujących do posortowanej listy. Wyprowadza słownik z zakresami wartości wymienionych w słowniku. Klawisze oddzielają każdy bieg kolejnych liczb i są również sumą całkowitą niesekwencyjnych pozycji pomiędzy liczbami w sekwencji.

Twoja lista daje mi moc {0: [1, 4], 1: [7, 8], 2: [10, 14]}

def series_dictf(index_list): 
    from collections import defaultdict  
    series_dict = defaultdict(list) 
    sequence_dict = dict() 

    list_len = len(index_list) 
    series_interrupts = 0  

    for i in range(list_len): 
     if i == (list_len - 1): 
       break 

     position_a = index_list[i] 
     position_b = index_list[i + 1] 

     if position_b == (position_a + 1): 
      sequence_dict[position_a] = (series_interrupts) 
      sequence_dict[position_b] = (series_interrupts) 

     if position_b != (position_a + 1): 
      series_interrupts += 1 

    for position, series in sequence_dict.items(): 
     series_dict[series].append(position) 
    for series, position in series_dict.items(): 
     series_dict[series] = [position[0], position[-1]] 

    return series_dict 
0

Korzystanie operację ustawioną następujący algorytm może być wykonany

def get_consecutive_integer_series(integer_list): 
    integer_list = sorted(integer_list) 
    start_item = integer_list[0] 
    end_item = integer_list[-1] 

    a = set(integer_list) # Set a 
    b = range(start_item, end_item+1) 

    # Pick items that are not in range. 
    c = set(b) - a # Set operation b-a 

    li = [] 
    start = 0 
    for i in sorted(c): 
     end = b.index(i) # Get end point of the list slicing 
     li.append(b[start:end]) # Slice list using values 
     start = end + 1 # Increment the start point for next slicing 
    li.append(b[start:]) # Add the last series 

    for sliced_list in li: 
     if not sliced_list: 
      # list is empty 
      continue 
     if len(sliced_list) == 1: 
      # If only one item found in list 
      yield sliced_list[0] 
     else: 
      yield "{0}-{1}".format(sliced_list[0], sliced_list[-1]) 


a = [1, 2, 3, 6, 7, 8, 4, 14, 15, 21] 
for series in get_consecutive_integer_series(a): 
    print series 

wyjście do powyższej listy "a"
1-4
6-8
14-15

-1

Można użyć biblioteki kolekcji, która ma klasę o nazwie Licznik.Licznik może się przydać, jeśli próbuje sondować no odrębnych elementów w dowolnym iterowalny

from collections import Counter 
data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28] 
cnt=Counter(data) 
print(cnt) 

wyjściu za to wygląda

Counter({1: 1, 4: 1, 5: 1, 6: 1, 10: 1, 15: 1, 16: 1, 17: 1, 18: 1, 22: 1, 25: 1, 26: 1, 27: 1, 28: 1}) 

który jak każdy inny słownika można ankietowanych do kluczowych wartości

+0

To nie odpowiada na pytanie w ogóle, liczysz tylko zdarzenia, podczas gdy OP chciał dla 'zakresów' – user1767754

0

Krótkie rozwiązanie, które działa bez dodatkowego importu. Akceptuje każdą iterable, sortuje wejść nieposortowane i usuwa duplikaty:

def ranges(nums): 
    nums = sorted(set(nums)) 
    gaps = [[s, e] for s, e in zip(nums, nums[1:]) if s+1 < e] 
    edges = iter(nums[:1] + sum(gaps, []) + nums[-1:]) 
    return list(zip(edges, edges)) 

Przykład:

>>> ranges([2, 3, 4, 7, 8, 9, 15]) 
[(2, 4), (7, 9), (15, 15)] 

>>> ranges([-1, 0, 1, 2, 3, 12, 13, 15, 100]) 
[(-1, 3), (12, 13), (15, 15), (100, 100)] 

>>> ranges(range(100)) 
[(0, 99)] 

>>> ranges([0]) 
[(0, 0)] 

>>> ranges([]) 
[] 

To jest taka sama jak @ dansalmo na solution który znalazłem niesamowite, choć trochę trudne do odczytania i zastosuj (ponieważ nie jest podana jako funkcja).

Należy zauważyć, że można go łatwo zmodyfikować w celu wyplucia "tradycyjnych" otwartych zakresów [start, end), np. zmieniając return:

return [(s, e+1) for s, e in zip(edges, edges)] 
Powiązane problemy