Próbuję odczytać .txt z brakującymi wartościami przy użyciu pandas.read_csv. Moje dane mają format:czytanie pliku z brakującymi wartościami w python pand
10/08/2012,12:10:10,name1,0.81,4.02,50;18.5701400N,4;07.7693770E,7.92,10.50,0.0106,4.30,0.0301
10/08/2012,12:10:11,name2,,,,,10.87,1.40,0.0099,9.70,0.0686
z tysiącami próbek o tej samej nazwie punktu, pozycji GPS i innych odczytów. używam kod:
myData = read_csv('~/data.txt', sep=',', na_values='')
kod jest źle jak na_values nie daje NaN lub inny wskaźnik. Kolumny powinny mieć ten sam rozmiar, ale kończę na innej długości.
Nie wiem, co dokładnie powinno być wpisane po na_values (próbowaliśmy wszystkie różne rzeczy). Dzięki
Jeśli "skiprows = 1", w pliku znajduje się pojedynczy wiersz. Bez tego parametru widzę wyraźne 'NaN's w DataFrame. – eumiro
Umieściłem tylko dwa wiersze moich danych, aby pokazać ich format. skiprows = 1 nie robi niczego z brakującymi danymi, w oryginalnym pliku jest 15000 linii, a pierwsze linie zawierają pewne nazwy, czego nie chcę. – tomasz74
Usunąłem 'skiprows = 1' dla jasności – tomasz74