Co jest najbardziej skutecznym sposobem na suwak dwie zagnieżdżone listy do słownika poziomu pojedynczego

na przykład:Co jest najbardziej skutecznym sposobem na suwak dwie zagnieżdżone listy do słownika poziomu pojedynczego

list1=['k1','k2','k3',['k4','k5',['k6','k7']]] 
list2=['v1','v2','v3',['v4','v5',['v6','v7']]]

i chcę połączyć je do słownika jak ten:

dict1={'k1':'v1','k2':'v2','k3':'v3','k4':'v4','k5':'v5','k6':'v6','k7':'v7'}

mam sposób, aby to zrobić, ale myślę, że zajmuje to zbyt dużo czasu:

def mergeToDict(keyList, valueList): 
    resultDict = {} 
    for key, value in itertools.izip(keyList, valueList): 
     if type(key) == list and type(value) == list: 
      resultDict=dict(resultDict,**mergeToDict(key, value)) 
     elif type(key) != list and type(key) != dict and type(key) != tuple: 
      resultDict[key] = value 
    return resultDict

Czy są jakieś lepsze pomysły?

Źródło

2012-02-14 BackMountainBird

Twoje rozwiązanie wygląda lepiej niż wszystkie z poniższych odpowiedzi. – jterrace

Nie sądzę, że musisz spłaszczyć w ogóle, jeśli masz tylko przypadki użycia, które przedstawiłeś (listy zagnieżdżone, ale o tym samym kształcie). Tutaj jest podejście, że przynajmniej na moim komputerze jest 2-3 razy szybciej niż twój (znowu działa tylko z tym ograniczać):

def appendDict(list1, list2, resultDict): 
    for idx, val in enumerate(list1): 
     if isinstance(val, list):  
      appendDict(val, list2[idx], resultDict) 
     else: 
      resultDict[val] = list2[idx] 

list1=['k1','k2','k3',['k4','k5',['k6','k7']]] 
list2=['v1','v2','v3',['v4','v5',['v6','v7']]] 
resultDict = {} 
appendDict(list1, list2, resultDict) 
print resultDict 

{'k3': 'v3', 'k2': 'v2', 'k1': 'v1', 'k7': 'v7', 'k6': 'v6', 'k5': 'v5', 'k4': 'v4'}

oraz porównanie metod:

metodą OP, na 10000 przebiegów : 0,290050983429

Inne metody zaproponowanej na 10000 seriach: 0,580717086792

metoda ta, na 10000 przebiegów: 0,155267000198

nie

Może jako elegancki jak inne rozwiązania, ale wydajność wydawała się być głównym problemem.

Źródło

2012-02-14 14:11:25 Bogdan

Zmienną globalną można równie dobrze przekazać jako parametr do funkcji, chodzi o to, że iterowała ona tylko na jednej z list i robi to tylko raz. – Bogdan

To naprawdę szybko. Może możesz przekazać "resultDict" jako argument, który wygląda lepiej. – BackMountainBird

użyję jakiś spłaszczyć funkcję:

def flatten(it): 
    if isinstance(it, str): 
     yield it 
     return 
    try: 
     for x in it: 
      for y in flatten(x): 
       yield y 
    except TypeError: 
     yield it

Teraz można zrobić

from itertools import izip 
my_dict = dict(izip(flatten(list1), flatten(list2)))

myślę, że ten sposób jest bardziej ogólne i bardziej przejrzysty dla czytelnika.

Źródło

2012-02-14 13:17:56

Przetestowałem twój kod, ale wygląda na to, że działa on dwa razy wolniej niż mój kod. – BackMountainBird

Istnieje możliwość optymalizacji w funkcji 'flatten()' - na przykład unikanie wyjątków za pomocą 'isinstance (it, collections.Iterable)' lub 'hasattr (it," __iter __ ")' lub tylko zstępujące na iterables typu 'lista'. Większość z tych zmian zaszkodzi ogólności lub czytelności, aby uzyskać niewielki wzrost wydajności. Jeśli wydajność jest naprawdę problemem, wątpię, aby to było miejsce do optymalizacji - raczej zmienić sposób, w jaki te listy są * tworzone * w pierwszej kolejności. W każdym przypadku * profil *, aby upewnić się, że optymalizuje się we właściwym miejscu. –

Widzę twój punkt widzenia. – BackMountainBird

Z flatten zdefiniowany jako:

>>> def flatten(l): 
...  r = [] 
...  for x in l: 
...    if isinstance(x, list): 
...      r.extend(flatten(x)) 
...    else: 
...      r.append(x) 
...  return r

dict(zip(flatten(list1), flatten(list2))) wydaje się tak szybko, jak Twoja. I jest to o wiele wygodniejsze podejście, jak mówili faceci.

Źródło

2012-02-14 13:44:52

Jeszcze trochę wolniej niż mój kod. – BackMountainBird

Lubię stosów i funkcji generatora:

def flatten(seq, *seq_types): 
    stack = [iter(seq)] 
    while stack: 
     for item in stack[-1]: 
      if isinstance(item, seq_types): 
       stack.append(iter(item)) 
       break 
      else: 
       yield item 
     else: 
      stack.pop() 

keys = [0, 1, (2, 3, [4.])] 
values = (5, 6, (7, "joe", [9])) 
print dict(zip(flatten(keys, list, tuple), flatten(values, tuple, list)))

Wynik:

{0: 5, 1: 6, 2: 7, 3: 'joe', 4.0: 9}

Lub, jeśli wiesz na pewno, że wykazy wejściowe mają taką samą strukturę, to może również pracować:

def flatten(seq, *seq_types): 
    seq = list(seq) 
    for item in seq: 
     if isinstance(item, seq_types): 
      seq.extend(item) 
     else: 
      yield item

Pamiętaj, że kolejność pozycji może ulec zmianie:

print list(flatten([1, 2, [3, 4, [5]]], list)) 
print list(flatten([1, 2, [[3, 4], 5]], list))

Wynik:

[1, 2, 3, 4, 5] 
[1, 2, 5, 3, 4]

Źródło

2012-02-14 14:50:20 pillmuncher

Co jest najbardziej skutecznym sposobem na suwak dwie zagnieżdżone listy do słownika poziomu pojedynczego

Odpowiedz

Powiązane problemy