2011-08-06 18 views
9

Mam dokument Excel z tabelą danych zawierającą chińskie znaki. Próbuję wyeksportować ten arkusz kalkulacyjny programu Excel do pliku CSV w celu zaimportowania do bazy danych MySQL.Jak wyeksportować plik Excela z chińskimi znakami do pliku CSV?

Jednak, gdy zapisuję dokument Excel jako plik CSV, Notatnik wyświetla wynikowe znaki chińskiego pliku CSV jako znaki zapytania. Importowanie do MySQL zachowuje znaki zapytania, całkowicie ignorując oryginalne chińskie znaki.

Podejrzewam, że może to mieć związek z używaniem programu Excel z kodowaniem UTF-8. Dzięki za pomoc!

+0

Notatnik jest sztuczny. Czy próbowałeś otworzyć go za pomocą prawdziwego edytora tekstu? takich jak notepad ++ lub ultraeditor. –

+0

Dzięki Huang. Próbowałem już Notepad ++, a następnie jEdit, które obsługują kodowanie UTF-8. Znaki zapytania nadal nie zmieniają się w chińskie znaki. Tak więc myślę, że Excel po prostu garci chińskie znaki, gdy importuje arkusz kalkulacyjny do formatu CSV. Wciąż szukam rozwiązania tego. – user534017

Odpowiedz

2

Możesz chcieć wypróbować notatnik ++, wątpię, aby notatnik obsługiwał znaki Unicode.

http://notepad-plus-plus.org/

+0

Notatnik obsługuje znaki Unicode, jeśli plik zaczyna się od czegoś rozpoznawanego jako znacznik kolejności bajtów, co jest naprawdę brzydką rzeczą w UTF-8 (zwłaszcza, że ​​UTF-8 _nie wymaga tego w pierwszej kolejności). –

+0

Witam, wyżej, wypróbowałem Notepad ++ i jEdit, które obsługują kodowanie UTF-8. Znów, znaki zapytania nadal nie zmieniają się w chińskie znaki. Tak więc myślę, że Excel po prostu garci chińskie znaki, gdy importuje arkusz kalkulacyjny do formatu CSV. Wciąż szukam rozwiązania tego. – user534017

+0

Program Excel nie eksportuje do pliku CSV w formacie UTF-8. Obsługuje tylko kodowanie UTF-8 w formacie "Tekst Unicode". – Nelson

8

O ile wiem, Excel nie zapisuje pliki CSV w dowolnym kodowaniu Unicode. Ostatnio miałem podobne problemy, aby wyeksportować plik jako plik CSV z symbolem £. Miałem tę zaletę, że mogłem w ogóle korzystać z innego narzędzia.

Moja wersja programu Excel 2010 może eksportować w formacie Unicode File > Save As > Unicode Text (.txt), ale wynikiem jest plik zakodowany w UCS-2 z rozdzielaną tabulatorami. Nie znam MySQL w ogóle, ale krótkie spojrzenie na specyfikacje i wydaje się obsługiwać importowany tabulator importowany i UCS-2. Być może warto wypróbować to wyjście.

Edit: Dodatkowo, zawsze można otworzyć wyjście Unicode w Notepad ++ przekonwertować go na UTF-8 Encoding > Convert to UTF-8 without BOM I ewentualnie zastąpić wszystkie znaki tabulacji z przecinkami zbyt (Użyj dialogu zamienianie w rozszerzonym trybie wyszukiwania \t w polu Znajdź i , . w polu Zamień)

7

Poniższa metoda została przetestowana i używany do importowania plików CSV w MongoDB, więc powinien działać:

  1. w arkuszu Excel, przejdź do Plik> Zapisz jako.

  2. Nazwij plik i wybierz tekst Unicode (* .txt) z listy rozwijanej obok "Zapisz jako typ", a następnie kliknij Zapisz.

  3. Otwórz plik .txt w formacie Unicode za pomocą preferowanego edytora tekstu, na przykład Notatnika.

  4. Ponieważ nasz plik tekstowy w formacie Unicode jest plikiem rozdzielanym tabulatorami i chcemy przekonwertować plik Excel na CSV (oddzielony przecinkami), musimy zamienić wszystkie karty przecinkami.

  5. Wybierz znak tabulacji, kliknij go prawym przyciskiem myszy i wybierz polecenie Kopiuj z menu kontekstowego, lub po prostu naciśnij CTRL + C, jak pokazano na zrzucie ekranu poniżej.

  6. Naciśnij klawisze CTRL + H, aby otworzyć okno dialogowe Zamień i wklej skopiowaną kartę (CTRL + V) w polu Znajdź. Gdy to zrobisz, kursor przesunie się w prawo, wskazując, że zakładka została wklejona. Wpisz przecinek w polu Zamień na i kliknij przycisk Zamień wszystko.

  7. Kliknij Plik> Zapisz jako, wprowadź nazwę pliku i zmień kodowanie na UTF-8. Następnie kliknij przycisk Zapisz.

  8. zmienić rozszerzenie txt do pliku .csv bezpośrednio w Notatniku w oknie dialogowym Zapisz jako i wybierz Wszystkie pliki (.) obok Zapisz jako typ, jak pokazano na poniższym zrzucie ekranu.

  9. Otwórz plik CSV z programu Excel, klikając opcję Plik> Otwórz> Pliki tekstowe (.prn, .txt, .csv) i sprawdź, czy dane są prawidłowe.

Źródło here

0

Próbowałem wszystkie powyższe metody moich danych, ale to nie dość pracy na przetwarzanie moich danych (chiński uproszczony, ponad 700MB. Próbowałem Windows, chiński i systemu angielskim, angielskim i chińskim Excel Windows nie wydaje się być w stanie zapisać do utf8, nawet jeśli twierdzi, że to robi. Podaję uft8 csv w trybie zapisu jako, ale kiedy używam "otwartego arkusza" do wykrycia kodowania, to nie jest to uft8, a nie GB * Oto moje ostateczne rozwiązanie:

(1) Pobierz "otwarty arkusz".

(2) Otwórz prawidłowo. Możesz przewijać metodę kodowania, dopóki nie zobaczysz chińskiego znaku wyświetlanego w oknach podglądu.

(3) Zapisz jako utf-8 (jeśli chcesz utf-8).

PS: Musisz określić domyślne kodowanie w swoim systemie. Jak dotąd wiem, że Ubuntu zajmuje się UTF8 dobrze. Ale domyślnie windows Simplied Chinese zaczyna się od GB **. Nawet jeśli zakodujesz go jako utf8, , możesz go również otworzyć. W moim przypadku, r nie mógł otworzyć mojego pliku csv utf-8, ale może otworzyć kodowanie GB *.

Ta metoda działa dobrze, nawet jeśli Twój plik jest bardzo duży. Niektóre inne prace wokół jest Google arkusz (ale rozmiar pliku może być ograniczona). Notepad ++ działa również dla mniejszych plików.

Istnieje sposób na wykrycie metod kodowania poprzez otwarcie pliku i przewijanie metod kodowania do momentu, aż chiński będzie wyświetlany poprawnie.

Powiązane problemy