Mam plik wejściowy, który ma około 20 milionów linii. Rozmiar pliku wynosi około 1,2 G. Czy mimo to mogę wykreślić dane w R. Niektóre z kolumn mają kategorie, większość z nich to liczby.Wykreślanie dużych plików danych w R?
Próbowałem mojego skryptu spiskowania z małym podzbiorem pliku wejściowego około 800K linii, ale mimo że mam około 8G pamięci RAM, nie wydaje mi się, aby móc wykreślić wszystkie dane. Czy istnieje prosty sposób na zrobienie tego.
Co masz nadzieję zobaczyć na wykresie z 20 milionami punktów danych? – Chase
Bez względu na pojemność obliczeniową, będziesz musiał zmniejszyć swoje dane poprzez histogramy, wykresy gęstości 1D i 2D, wykresy heksabinowe, ... –
... kontynuując zgodnie z odpowiedzią @Paul Hiemstra poniżej - jeśli dasz trochę więcej szczegółów na temat (podzbioru) danych można uzyskać interesującą dyskusję na temat możliwości wizualizacji. Ponadto, 'ggplot' może być wolniejszy/bardziej głodny pamięci niż inne możliwości, jeśli naprawdę chcesz wykreślić każdy punkt. –