Mam CSV z pliku danych, które można załadować na badania z użyciem read.csv()
Filtrowanie danych w R
Niektóre z danych brakuje, więc chcę, aby zmniejszyć ramkę danych w dół, aby ustawić, które składa się w całości z non -misujące dane, tj. jeśli w dowolnym miejscu pojawi się NULL
, chcę wykluczyć tę kolumnę i wiersz z przefiltrowanego zestawu danych.
Wiem, że prawdopodobnie mogę to zrobić po prostu z wbudowanymi operacjami wektorowymi R, ale nie jestem do końca pewien, jak to zrobić dokładnie?
Aby moje pytanie było trochę bardziej konkretne, oto krótka próbka danych, dzięki czemu można zobaczyć, co chcę zrobić.
DocID Anno1 Anno7 Anno8
1 7 NULL 8
2 8 NULL 3
44 10 2 3
45 6 6 6
46 1 3 4
49 3 8 5
62 4 NULL 9
63 2 NULL 4
67 11 NULL 3
91 NULL 9 7
92 NULL 7 5
93 NULL 8 8
Tak więc biorąc pod uwagę to wejście, potrzebuję trochę kodu, który zredukuje wyjście do tego.
DocID Anno8
44 3
45 6
46 4
49 5
jako Anno8
jest tylko kolumna dane NULL, i są tylko cztery rzędy z danymi nie NULL.
Dzięki @rguha, jest to przydatne. Jak by to działało, gdybym chciał pozbyć się w określonej kolumnie csv jakiejkolwiek wartości, która jest mniejsza niż powiedzmy 5? – Rodolphe