Próbowałem wszystkie powyższe metody moich danych, ale to nie dość pracy na przetwarzanie moich danych (chiński uproszczony, ponad 700MB. Próbowałem Windows, chiński i systemu angielskim, angielskim i chińskim Excel Windows nie wydaje się być w stanie zapisać do utf8, nawet jeśli twierdzi, że to robi. Podaję uft8 csv w trybie zapisu jako, ale kiedy używam "otwartego arkusza" do wykrycia kodowania, to nie jest to uft8, a nie GB * Oto moje ostateczne rozwiązanie:
(1) Pobierz "otwarty arkusz".
(2) Otwórz prawidłowo. Możesz przewijać metodę kodowania, dopóki nie zobaczysz chińskiego znaku wyświetlanego w oknach podglądu.
(3) Zapisz jako utf-8 (jeśli chcesz utf-8).
PS: Musisz określić domyślne kodowanie w swoim systemie. Jak dotąd wiem, że Ubuntu zajmuje się UTF8 dobrze. Ale domyślnie windows Simplied Chinese zaczyna się od GB **. Nawet jeśli zakodujesz go jako utf8, , możesz go również otworzyć. W moim przypadku, r nie mógł otworzyć mojego pliku csv utf-8, ale może otworzyć kodowanie GB *.
Ta metoda działa dobrze, nawet jeśli Twój plik jest bardzo duży. Niektóre inne prace wokół jest Google arkusz (ale rozmiar pliku może być ograniczona). Notepad ++ działa również dla mniejszych plików.
Istnieje sposób na wykrycie metod kodowania poprzez otwarcie pliku i przewijanie metod kodowania do momentu, aż chiński będzie wyświetlany poprawnie.
Notatnik jest sztuczny. Czy próbowałeś otworzyć go za pomocą prawdziwego edytora tekstu? takich jak notepad ++ lub ultraeditor. –
Dzięki Huang. Próbowałem już Notepad ++, a następnie jEdit, które obsługują kodowanie UTF-8. Znaki zapytania nadal nie zmieniają się w chińskie znaki. Tak więc myślę, że Excel po prostu garci chińskie znaki, gdy importuje arkusz kalkulacyjny do formatu CSV. Wciąż szukam rozwiązania tego. – user534017