czytam gazetę k-means++: The Advantages of Careful Seeding i nie bardzo rozumiem algorytmu przewidzianego która jest:K-means ++ algorytm
„Niech D (x) oznacza najkrótszą odległość od punktu danych X do najbliższego centrum już mamy wybrany.
1a. wybrać początkowe centrum c1 równomiernie losowo z X.
1b. Wybór następnego środkowego cl, wybierając CI = x '∈ x z prawdopodobieństwem (D (x')^2)/Sum_of (D (x)^2)
1 do. Powtarzaj krok 1b, dopóki nie wybraliśmy w sumie k centrów.
2-4. Należy postępować zgodnie ze standardową K oznacza algorytm „
(lepiej przyjrzeć algorytmu w linku powyżej)
zwłaszcza kroku 1b. Co one oznaczają przez” wybierając CI = x”∈ X z prawdopodobieństwem (D (x ')^2)/Sumof (D (x)^2) "Czy chodzi o wybór elementu, który ma największą proporcję? A w jaki sposób wykonanie takich obliczeń może doprowadzić do wyboru optymalnych centroidów?
Nie wiem, dlaczego to otrzymało -1. – icedwater