2015-04-25 8 views
5

Pracuję nad wykresem bąbelkowym i mam problem z obliczeniem promienia bąbelkowego.Czy istnieje jakiś algorytm do mapowania listy liczb dla niektórych, które różnią się mniej?

Chcę użyć pewnej ilości do obliczenia promienia bąbelkowego, ale ilość jest bardzo różna. Minimalna wartość to 340, maksymalna to 190000, ale większość punktów mieści się w przedziale od 5000 do 30000. Zakresy te są zbyt ekstremalne, aby bezpośrednio użyć ich jako promienia.

Czy istnieje algorytm "wygładzający" krzywą danych? Lub jakąś metodę odwzorowania pierwotnej ilości na bardziej rozsądną?

Teraz mój wykres to wykres punktowy, ponieważ nie mogę przetłumaczyć go na wykres bąbelkowy bez promienia.

+0

Jeśli odwzorujesz wartości na inny zakres, w jaki sposób upewnisz się, że nadal reprezentują one w odpowiedni sposób ilości? Czy chcesz zachować "grupowanie" wartości na obrazku [5000, 30000]? Nie jestem pewien, czy wykres bąbelkowy będzie tu najlepszą opcją; może bardziej odpowiedni będzie wykres rozproszenia ze skalą kolorów dla danej ilości? –

+0

log (wartość) jest rutynowo używana do "linearyzacji" ekstremalnych wartości i zmniejszenia zakresu. –

+0

Ponieważ ludzie nie są w stanie rozpoznać magnitudości bardzo dobrze, używam tylko bańki, aby w przybliżeniu reprezentować ilości. Nie ma zbyt wiele potrzebnych mocy. "Kolor" jest już używany do reprezentowania działu infomation.log (wartość) jest dość sprytny method:) – Jim

Odpowiedz

2

Czy rozważałeś użycie logarytmu swoich danych? Korzystanie z bazy 10 na przykład, swoje granice stają

| Original | Log_10 | 
|  340 | 2.5 | 
| 5,000 | 3.7 | 
| 30,000 | 4.5 | 
| 190,000 | 5.3 | 
+0

Logarytm jest dość sprytny w tym wydaniu :) – Jim

0

Coś innego można rozważyć, jeśli nie zostało to zrobione, podejmuje pierwiastkowania swoich danych i stosując je jako promieni, więc obszar pęcherzyki są proporcjonalne do liczb. Wtedy wasze promienie będą się różnić od około 20 do około 500, w stosunku około 20: 1.

Powiązane problemy