Mam prostą tablicę numpy, dla każdej daty jest punkt danych. Coś takiego:Czy w pytonie można łatwo ekstrapolować punkty danych do przyszłości?
>>> import numpy as np
>>> from datetime import date
>>> from datetime import date
>>> x = np.array([(date(2008,3,5), 4800), (date(2008,3,15), 4000), (date(2008,3,
20), 3500), (date(2008,4,5), 3000) ])
Czy istnieje prosty sposób ekstrapolować punktów danych na przyszłość: data (2008,5,1), data (2008, 5, 20) itp? Rozumiem, że można to zrobić za pomocą algorytmów matematycznych. Ale tutaj szukam jakiegoś niskiego wiszącego owocu. Właściwie to lubię to, co robi numpy.linalg.solve, ale nie nadaje się do ekstrapolacji. Może jestem absolutnie zły.
Właściwie bardziej konkretnie buduję wykres wypalania (termin xp): "x = data i y = objętość pracy do wykonania", więc mam już wykonane sprinty i chcę wizualizować jak pójdą przyszłe sprinty, jeśli obecna sytuacja się utrzyma. I na koniec chcę przewidzieć datę premiery. Tak więc charakter "ilości pracy do zrobienia" jest zawsze obniżany na wykresach spalania. Również chcę uzyskać ekstrapolowaną datę wydania: data, kiedy objętość staje się zero.
To wszystko po to, aby pokazać zespołowi programistów, jak to wszystko wygląda. Dokładność nie jest tu tak ważna :) Głównym czynnikiem jest motywacja zespołu deweloperskiego. Oznacza to, że jestem absolutnie w porządku z bardzo przybliżoną techniką ekstrapolacji.
Podczas wyszukiwania w "Pythonie statystyk" co znalazłeś? Masz pytania na temat któregokolwiek z znalezionych pakietów statystycznych? –
Trudno mówić o jakiejkolwiek ekstrapolacji, nie znając charakteru danych, o których mowa. Powyższe, o ile można zobaczyć, może być dowolne (nie wyłączając wartości losowych), więc mówienie o jakiejkolwiek praktycznej metodzie byłoby po prostu spekulacją. Uściślij pytanie. – Rook
masz absolutną rację! rafinowany. – maplpro