Próbuję otworzyć plik CSV zakodowany w UTF-8, który zawiera (tradycyjne) znaki chińskie w R. Z jakiegoś powodu, R wyświetla informacje czasem jako znaki chińskie, czasami jako kod Unicode postacie.Wyświetlanie znaków chińskich zakodowanych w UTF-8 w R
Na przykład:
data <-read.csv("mydata.csv", encoding="UTF-8")
data
będzie produkować znaki Unicode, przy czym:
data <-read.csv("mydata.csv", encoding="UTF-8")
data[,1]
rzeczywiście wyświetlania znaków chińskich.
Jeśli zmieni się to w matrycę, będzie również wyświetlać chińskie znaki, ale jeśli spróbuję spojrzeć na dane (polecenie Zobacz (dane) lub naprawić (dane)), znowu jest w Unicode.
Poprosiłem o poradę od osób używających komputera Mac (korzystam z komputera PC, Windows 7), a niektóre z nich mają chińskie znaki, inne nie. Próbowałem zapisać oryginalne dane w postaci tabeli i odczytać ją w R w ten sposób - ten sam wynik. Próbowałem uruchomić skrypt w RStudio, Revolution R i RGui. Próbowałem dostosować ustawienia narodowe (np. Chińskie), ale albo R nie pozwolił mi tego zmienić, albo wynik był bełkotem zamiast znaków unicode.
My prąd regionalne są:
"LC_COLLATE = French_Switzerland.1252; LC_CTYPE = French_Switzerland.1252; LC_MONETARY = French_Switzerland.1252; LC_NUMERIC = C; LC_TIME = French_Switzerland.1252"
Jakakolwiek pomoc, aby R konsekwentnie wyświetlać chińskie znaki, byłby bardzo doceniany ...
Hm, wygląda to jak robaka. Zainteresowani mogą łatwo odtworzyć ten kod: 'x = c ('中華民族'); x; data.frame (x)'.Nie próbuj wklejać tego kodu do edytora R, po prostu wklej go bezpośrednio do konsoli lub nie zadziała. – nograpes
Zobacz moją odpowiedź na http://stackoverflow.com/questions/22876746/how-to-read-data-in-utf-8-format-in-r – Sathish