Prawdopodobnie masz dwa problemy. Ale cofnijmy się ... Nie wiemy, czy tekst został nieprawidłowo zaimportowany, nieprawidłowo wyeksportowany, czy po prostu wyświetlany w głupkowaty sposób.
Po pierwsze, mam zamiar omówić „importowania” ...
Nie próbuj zmieniać kodowanie. Zamiast tego żyj z kodowaniem. Ale najpierw sprawdź, jakie jest kodowanie. Może to być latin1 lub może być ut8. (Lub dowolne z wielu mniej prawdopodobnych zestawów znaków).
Dowiedz się, jaki jest heks dla przychodzącego pliku. W Pythonie, kod jest coś takiego na hex (ETC) dumpingu ciąg u
:
for i, c in enumerate(u):
print i, '%04x' % ord(c), unicodedata.category(c),
print unicodedata.name(c)
Możesz iść here zobaczyć listę wartości hex dla wszystkich latin1 znaków wraz z hex utf8. Na przykład: ó
to latin1 F3
lub utf8 C2B3
.
Teraz uzbrojony w znajomość kodowania, powiedz MySQL, że.
LOAD DATA INFILE ...
...
CHARACTER SET utf8 -- or latin1
...;
Tymczasem, to nie ma znaczenia co CHARACTER SET ...
tabelę lub kolumna określa się; mysql transkoduje w razie potrzeby. Wszystkie znaki hiszpańskie są dostępne w latin1 i utf8.
Przejdź do this Q&A.
Zasugerowałem, że masz dwa błędy, jeden to wspomniany tam przypadek "czarnego diamentu"; tam jest coś innego. Ale ... Postępuj zgodnie z "Najlepszą praktyką" wspomniano.
Powrót do was pytanie o „eksporcie” ...
Znowu trzeba sprawdzić hex pliku wyjściowego. Znowu nie ma znaczenia, czy jest to latin1 czy utf8. Jednak ... Jeśli hex jest C383C2B3
dla po prostu ó
, masz "podwójne kodowanie". Jeśli tak, sprawdź, czy usunąłeś wszystkie ręczne wywołania funkcji konwersji i po prostu powiedział MySQL co jest.
Oto niektóre dodatkowe informacje, które mogą być potrzebne.
Jeśli potrzebujesz dodatkowej pomocy, postępuj zgodnie z tekstem krok po kroku. Pokaż nam kod służący do przenoszenia/konwertowania go na każdym kroku i pokaż nam HEX na każdym kroku.
czy możesz podać przykład tego, co próbujesz rozszyfrować, ponieważ tylko błąd nie jest łatwy do odtworzenia problemu i znalezienia możliwego rozwiązania ... – coder
w polach csv pola wyglądają następująco: np. DIRECCI N BARCELONA, v lida hasta, itp. – alexsc