2012-04-07 15 views
5

Mam tysiące punktów danych i każdy punkt danych ma 50 wymiarów. Chciałbym zobaczyć rzadkość danych przy użyciu java. Czy istnieje pakiet/metody java do wykreślania takich danych o dużych wymiarach.wykreślanie dużych danych w java

+0

Niezależnie od języka, jak można się spodziewać wizualizacji danych 50-wymiarowych? –

+2

Ile wymiarów jesteś w stanie od razu dostrzec? –

+0

Chciałbym zobaczyć w 2-D, tak, ale o to pytam, czy istnieją narzędzia, które mogą wykonać redukcję wymiaru i wykreślić go w 2D, aby zobaczyć relację między różnymi punktami danych. – thetna

Odpowiedz

1

To, czego potrzebujesz, to multidimensional scaling. Zasadniczo zmniejsza to wymiarowość przestrzeni danych, starając się zachować odległości.

Dzięki temu możesz pobrać pakiet MDS, zmniejszyć dane do 2D (lub 3D) i narysować je za pomocą biblioteki graficznej 2D/3D (swing, jogl).

Może działać lub nie, w zależności od liczby punktów danych i miejsca, w którym się znajdują. W przypadku 50 wymiarów możesz mieć dużo szczęścia, ale to naprawdę zależy.

Szybkie google dla realizacji java got me this

Jest to pakiet w R też, więc można użyć.

+0

Chcę wykreślić te punkty i zobaczyć, jak są one powiązane. Które punkty danych są powiązane i które punkty danych nie są podobne. Jeśli nie są podobne, jak daleko są. – thetna

+0

to dokładnie to, co robi mds. To zajmuje twoje punkty i redukuje wymiarowość, dzięki czemu możesz je narysować dowolną biblioteką graficzną. – soulcheck

+0

Mam na myśli to, że mając punkty w przestrzeni 2D, możesz je wykreślić nawet za pomocą huśtawki – soulcheck