Rozważmy następujący kodEfektywne rozdzielanie danych w Pythonie
one, two = sales.random_split(0.5, seed=0)
set_1, set_2 = one.random_split(0.5, seed=0)
set_3, set_4 = two.random_split(0.5, seed=0)
Co staram się w ten kod jest losowo podzielone moich danych w Sales
Sframe (który jest podobny do Pandy DataFrame) do około 4 równe części.
Co to jest Pythonowy/Wydajny sposób, aby to osiągnąć?
Czy możesz wyjaśnić, dlaczego nie jest to Pythoniczne lub wydajne, jak napisane? Jednym z problemów, jaki widzę, jest tworzenie wielu fałd, które nie są potęgą dwójki, ale to brzmi inaczej niż o to pytasz. – papayawarrior