2013-03-02 7 views
9

Mam wątpliwości co do funkcji hist matlib.W jaki sposób interpretowane są bin histogramu pyplot?

Dokumentacja wyjaśnia

Jeżeli sekwencja wartości, wartości dolnej granicy pojemników do użycia.

Ale kiedy mam dwie wartości w sekwencji tj. [0,1], otrzymuję tylko 1 pojemnik. A kiedy mam trzy tak:

plt.hist(votes, bins=[0,1,2], normed=True) 

mam tylko dwa kosze. Domyślam się, że ostatnia wartość to tylko górna granica dla ostatniego pojemnika.

Czy istnieje sposób na zachowanie "reszty" wartości w ostatnim pojemniku, poza tym, że ma tam bardzo dużą wartość? (Lub innymi słowy, bez dokonywania tego pojemnika znacznie większy niż inni)

Wydaje się, że ostatnia wartość bin znajduje się w ostatniej bin

votes = [0,0,1,2] 
plt.hist(votes, bins=[0,1]) 

Daje mi jeden pojemnik o wysokości 3. tj. 0,0,1. Podczas:

votes = [0,0,1,2] 
plt.hist(votes, bins=[0,1,2]) 

Daje mi dwa kosze z dwoma w każdym. Uważam, że ten licznik jest intuicyjny, że dodanie nowego bin zmienia szerokość limitów pozostałych.

votes = [0,0,1] 
plit.hist[votes, bins=2) 

yeilds dwa pojemniki o rozmiarze 2 i 1. Te wydaje się być podzielona na 0,5 od osi x idzie od 0 do 1.

Jak tablica pojemniki należy interpretować? W jaki sposób dzieli się dane?

+1

Jaką wersję 'mpl' używasz? W przeszłości jakiś czas temu zmieniła się funkcja 'numpy', która zmieniła nieco znaczenie" binów ", ważne jest, aby upewnić się, że patrzysz na dokumentację, która pasuje do używanych wersji. – tacaswell

+0

Używam wersji 1.6.1. Dziękuję za notatkę. –

Odpowiedz

15
votes = [0, 0, 1, 2] 
plt.hist(votes, bins=[0,1]) 

to daje jeden bin wysokości 3, ponieważ dzieli dane w jednym pojemniku z przedziału: [0, 1]. To stawia pod tym bin wartości: 0, 0 i 1.

votes = [0, 0, 1, 2] 
plt.hist(votes, bins=[0, 1, 2]) 

to daje histogram z pojemników z przedziałów: [0, 1 [a [1, 2]; , więc masz 2 przedmioty w 1 pojemniku (0 i 0) i 2 przedmioty w 2 pojemniku (1 i 2).

Jeśli próbujesz działki:

plt.hist(votes, bins=[0, 1, 2, 3]) 

Ideą podziału danych do pojemników jest taka sama: dostaniesz trzy przedziały: [0, 1 [; [1, 2 [; [2, 3], a zauważysz, że wartość 2 zmienia swój bin, przechodząc do kosza z przedziałem [2, 3] (zamiast pozostać w koszu [1, 2], jak w poprzednim przykładzie).

Podsumowując, jeśli masz uporządkowaną tablicę w argumentach pojemników, takich jak: [i_0, i_1, i_2, i_3, i_4, ..., I_N] że tworzy pojemników:
[i_0, i_1 [
[i_1, I_2 [
[I_2, Ci_3 [
[i_3, i_4 [
...
[i_ (N- 1), i_n]

z granicami każdej otwartej lub zamkniętej zgodnie z nawiasami.

+6

Innym sposobem na uczynienie tego jasnym/zachowującym się lepiej, jest odjęcie '0,5' od krawędzi bin (jeśli spodziewasz się, że wartości w' votes' będą liczbami całkowitymi), możesz krok po kroku uzyskać te szczegóły dotyczące zbiorów otwartych/zamkniętych. – tacaswell

+0

również +1 dla super jasnego wyjaśnienia szczegółów otwartego/zamkniętego zestawu problemów. – tacaswell

+0

Wyjaśnienie. Dziękuję Ci! –

Powiązane problemy