Mam setki dużych plików CSV, które chciałbym scalić w jeden. Jednak nie wszystkie pliki CSV zawierają wszystkie kolumny. Dlatego muszę scalić na podstawie nazwy kolumny, a nie pozycji kolumny.Scal CSV w python z różnymi kolumnami
Po prostu, aby było jasne: w połączonym pliku CSV wartości powinny być puste dla komórki pochodzącej z linii, która nie ma kolumny tej komórki.
Nie mogę użyć modułu pandy, ponieważ powoduje to, że brakuje mi pamięci.
Czy istnieje moduł, który może to zrobić, lub jakiś łatwy kod?
Dzięki! To działa, ale wszystkie wejściowe pliki CSV mają nagłówki i są powtarzane w połączonym pliku z powyższym kodem. Jak upuścić tę linię dla każdego pliku z wyjątkiem pierwszego? –
W rzeczywistości moje kolumny nie są wyrównane w scalonym dokumencie. Próbuję zrozumieć dlaczego. –
223 kolumn w moim out.csv, ale moja długość pola to 368 ...? –