Próbuję użyć Pandas, aby rozwiązać problem dzięki uprzejmości idiota DBA, nie robiąc kopii zapasowej obecnie uszkodzonego zestawu danych, więc próbuję znaleźć różnice między dwiema kolumnami. Z powodów, dla których nie będę miał dostępu, używam Pand zamiast bazy danych.Jak wykonać rozłączną lub ustawioną różnicę w stylu SQL na dwóch obiektach DataFrame Pandy?
Co chciałbym zrobić, to, biorąc pod uwagę:
Dataset A = [A, B, C, D, E]
Dataset B = [C, D, E, F]
chciałbym znaleźć wartości, które są rozłączne.
Dataset A!=B = [A, B, F]
W języku SQL jest to standardowa logika zestawu, realizowana w różny sposób w zależności od dialektu, ale standardowa funkcja. Jak elegancko zastosować to w Pandach? Chciałbym wprowadzić jakiś kod, ale nic, co mam, nie jest nawet poprawne. Jest to sytuacja, w której nie wiem, czego nie wiem ... Pandy ustawiły logikę dla skrzyżowania i unii, ale nic dla rozłącznej/ustalonej różnicy.
Dzięki!
Dzięki, to działało fantastycznie! – JPKab