Zastanawiam się, czy ktoś wcześniej widział ten problem z Pandami. Zasadniczo próbuję dodać, pomnożyć i podzielić element DataFrames element po elemencie (wszystkie ramki mają identyczne indeksy i kolumny), ale Pandy wypluwają różne wyniki dla tych samych obliczeń wykonywanych kolejno.Niestabilność obliczeń ramek danych pandy
Obraz niektórych przykładowych wyników przedstawiono poniżej. Użyłem kodu .values
w poniższym kodzie, ponieważ w celach wyświetlania, ale niestabilność może się zdarzyć podczas używania .add()
, .mul()
lub .div()
. Na przykład, jeśli wielokrotnie wprowadzam N11.add(N00)
, zazwyczaj otrzymuję poprawną odpowiedź, ale czasami (co 4 lub 5 raz) otrzymuję ramkę DataFrame wypełnioną zerami.
Jeśli ma to znaczenie, jestem na Windows 10 przy użyciu dystrybucji Anakonda pand 0.17.0 (z Pythona na Spyder 2.7.10 2.3.7). Ramki, z którymi pracuję są duże (6856 na 12511). Czy ktoś inny napotkał ten problem? Czy jest to znany problem, czy też robię coś złego?
Interesujące - czy można odtworzyć zachowanie za pomocą mniejszych DataFrames i opublikować je jako część pytania tutaj? –
(Także jeśli po prostu mnożysz tablice NumPy, może to być problem NumPy.) –
OK, próbowałem go z mniejszą ramką 10x10 i nie mogłem go odtworzyć po prawie 100 próbach. Więc może rozmiar ma tutaj znaczenie. – user3111891