Jestem stosunkowo nowy w "dużym przetwarzaniu danych" w r tutaj, mam nadzieję, że poszukam jakiegoś poradnika jak radzić sobie z plikiem csv o pojemności 50 GB. Obecny problem jest następujący:Jak radzić sobie z dużym plikiem csv o pojemności 50 GB w języku r?
Stół wyglądało:
ID,Address,City,States,... (50 more fields of characteristics of a house)
1,1,1st street,Chicago,IL,...
# the first 1 is caused by write.csv, they created an index raw in the file
chciałbym znaleźć wszystkie wiersze, które są należące San Francisco, CA. To powinien być łatwy problem, ale csv jest zbyt duży.
wiem, że mam dwie możliwości robi to w R i inny sposób na wykorzystanie bazy danych, aby go obsługiwać:
(1) Za pomocą pakietów ffdf R to:
od ostatniego razu plik jest zapisywany, to korzystał z write.csv i zawiera wszystkie różne typy.
all <- read.csv.ffdf(
file="<path of large file>",
sep = ",",
header=TRUE,
VERBOSE=TRUE,
first.rows=10000,
next.rows=50000,
)
konsola daje mi to:
Error in ff(initdata = initdata, length = length, levels = levels, ordered = ordered,
: vmode 'character' not implemented
Przeszukiwanie internecie, znalazłem kilka odpowiedzi, które nie pasują do mojej sprawy, a ja naprawdę nie mogę zrozumieć, jak przenieść „charakteru” do typu "czynnik", jak wspomniano.
Potem próbowałem użyć pliku read.table.ffdf, to jeszcze bardziej katastrofa. Nie mogę znaleźć solidnego przewodnika dla tego.
(2) Korzystanie R jest readline:
wiem, że to kolejny dobry sposób, ale nie może znaleźć skuteczny sposób, aby to zrobić.
(3) Za pomocą SQL:
Nie jestem pewien, jak przenieść plik do wersji SQL i jak sobie z tym poradzić, jeśli nie jest dobrym przewodnikiem chciałbym spróbować. Ale ogólnie, chciałbym pozostać przy R.
Dzięki za odpowiedź i pomoc!
Sprawdź, czy [ta odpowiedź] (http://stackoverflow.com/questions/23197243/how-do-i-read-only-lines-that-fulfil-a-ondition-from-a-csv-into- r) pomaga. –
w v. Podobny do ^^ link http://stackoverflow.com/questions/26861951/using-read-csv-sql-to-select-multiple-values- from-a-single-column – user20650
Sprawdź to dzięki! – windsound