odczytywania plików tekstowych z wykorzystaniem read.table

Mam plik tekstowy z kolumny id i name, a ja staram się czytać je w ramki danych w R:odczytywania plików tekstowych z wykorzystaniem read.table

d = read.table("foobar.txt", sep="\t")

Ale z jakiegoś powodu, wiele linii połączyły się - na przykład w wierszu 500 mojej ramki danych, zobaczę coś takiego

row 500: 500 Bob\n501\tChris\n502\tGrace

[Więc jeśli mój oryginalny plik tekstowy ma, powiedzmy, 5000 linie, wymiary będą moim stole kończy się na 1000 rzędach i 2 kolumnach.]

Kilka razy miałem to do czynienia. Czy ktoś wie, co to jest problem, lub jak to naprawić?

Źródło

2009-09-10 Anonymous

Proszę podać plik (lub jego części), ponieważ nie jest jasne, co zrobiłeś źle. –

Od pobieżnego spojrzenia na Twój błąd, przynajmniej jeden problem może polegać na tym, że '500' i' Bob' nie są oddzielone tabulatorem. –

Od ?read.table: Liczba kolumn danych jest określana na podstawie pierwszych pięciu linii danych wejściowych (lub całego pliku, jeśli ma mniej niż pięć linii), lub z długości nazw kolumn, jeśli została określona i jest dłuższe. Może to być błędne, jeśli wypełnienie lub puste.lines.skip są prawdziwe, więc w razie potrzeby podaj nazwy kolumn.

Twój plik danych może nie być czysty. Będąc bardziej specyficzne pomoże import danych:

d = read.table("foobar.txt", 
       sep="\t", 
       col.names=c("id", "name"), 
       fill=FALSE, 
       strip.white=TRUE)

określi dokładną kolumn i fill=FALSE wymusi danych ramki dwóch kolumn.

Źródło

2009-09-12 21:56:45 ayman

cześć .. czy można czytać niestrukturalne pliki tekstowe? –

Myślę, że zapomniałeś nazwy pierwszego parametru: '(file =" footer.txt ", ...)' – iTurki

@JayNirgudkar Przyjrzyj się 'scan' i' readLines'. – lmo

odczytywania plików tekstowych z wykorzystaniem read.table

Odpowiedz

Powiązane problemy