Mam duży zestaw danych, który składa się z około 94 kolumn i 3 milionów wierszy. Ten plik ma pojedyncze i wiele spacji jako ogranicznik między kolumnami. Muszę przeczytać kilka kolumn z tego pliku w R. Z tego Próbowałem za pomocą read.table() z opcjami, które można zobaczyć w poniższym kodzie, kod jest wklejony below-Czytanie pliku tekstowego z wieloma spacjami jako ogranicznikiem w R
### Defining the columns to be read from the file, the first 5 column, then we do not read next 24, after this we read next 5 columns. Last 60 columns are not read in-
col_classes = c(rep("character",2), rep("numeric", 3), rep("NULL",24), rep("numeric", 5), rep("NULL", 60))
### Reading first 100 rows of the data
data <- read.table(file, sep = " ",header = F, nrows = 100, na.strings ="", stringsAsFactors= F)
ponieważ plik, który musi czytać ma więcej niż jedną spację jako ogranicznik między niektórymi kolumnami, powyższa metoda nie działa. Czy istnieje metoda, za pomocą której możemy sprawnie czytać w tym pliku.
Wystarczy usunąć argument "sep =" "'. 'read.table' domyślnie wie, jak obsługiwać wiele spacji. –
Mam bardzo podobny problem, ale potrzebuję bardziej ogólnego rozwiązania, ponieważ mam pojedyncze przestrzenie na niektórych polach. Oznacza to, że powinienem być w stanie ustawić minimalną liczbę kolejnych spacji (w moim przypadku 2), aby były traktowane jako separatory, bez limitu. – EdM
Powiązany post: https://stackoverflow.com/questions/30955464/reading-aligned-column-data-with-fread – zx8754