2013-05-07 17 views
14

Uruchamiam algorytm grupowania i chcę ocenić wynik, korzystając z wyniku sylwetki w nauce scikit. Ale w nauce scikit trzeba obliczyć matrycę odległości: odległości = parami_dmisek (X, metryczne = metryczne, ** kwds)Jak naprawić błąd MemoryError podczas wykonywania wyniku scikit-learns?

Z uwagi na fakt, że moje dane są rzędu 300K, a moja pamięć to 2 GB , a wynikiem jest brak pamięci. I nie mogę ocenić wyniku grupowania.

Czy ktoś wie, jak rozwiązać ten problem?

Odpowiedz

20

Ustaw parametr sample_size w wywołaniu na silhouette_score na wartość mniejszą niż 300 KB. Użycie tego parametru spowoduje pobranie przykładowych punktów danych z X i obliczenie silhouette_score na tych zamiast całej tablicy.

+1

dziękuję za odpowiedź. Myślę, że byłoby to dobre rozwiązanie. Będę próbował wielu powtórzeń, a następnie weź średnią punktacji. –

+0

To działa dla silhouette_score, ale nie ma silhouette_samples nie ma takiego parametru sample_size – Keith

Powiązane problemy