2013-07-21 20 views
5

Mam dwa pytania, aby być precyzyjnym. Po pierwsze, chciałbym wiedzieć, czy istnieje prosty sposób na dostosowanie algorytmu klastrowania Markov, aby móc z góry określić, ile klastrów chciałbym mieć na końcu. Jeśli nie, jaki algorytm zaleciłbyś?Klaster Markowa

A po drugie, jak należy sobie poradzić z nakładającymi się klastrami w świecie Markowa?

Odpowiedz

13

1). Nie ma łatwego sposobu na adaptację algorytmu MCL (uwaga: jego nazwa brzmi "algorytm klastra Markowa" bez "ing".) Wiele osób zwerbalizuje go tak, jak w "tworzeniu klastrów Markowa", co jest w porządku, aby wyprowadzić określoną liczbę klastrów . Jest to moim zdaniem, dla 99,99% czasu bardzo pożądaną cechą. Gdybym robił to, co chcesz, generowałbym 4 lub 5 klastrów na różnych poziomach ziarnistości (np. Ustawiając parametr inflacji MCL na 1,4, 2,0, 3,0, 4,0 i 6,0, ale warto byłoby zrobić jeszcze kilka i wybierz na podstawie dystrybucji rozmiarów klastra), a następnie ujednolic je w hierarchicznym klastrze (program "zamknij program" może to zrobić). Następnie można przejść przez drzewo i spróbować znaleźć optymalną grupę o pożądanej wielkości. To oczywiście wymaga znacznego wysiłku. Zrobiłem coś podobnego, ale nie całkiem takie samo w przeszłości.

2). Nakładające się klastry produkowane przez MCL są niezwykle rzadkie i zawsze są wynikiem symetrii na wykresie wejściowym. Standardowa implementacja MCL, z której korzysta większość osób (z http://micans.org/mcl/) usunie nakładanie. Moim zdaniem nie jest to problemem. Zastrzeżenie: Jestem autorem MCL.

+0

Cóż, to naprawdę dobry pomysł. używanie różnych wartości inflacji to próba i błąd, ale wykonalne. dzięki. – user2560216

+0

Aktualny program rozwoju mcl ma nową opcję, w której określone jest klastrowanie wejściowe: zbuduje podgraph na tym grupowaniu (usuwając krawędzie między skupieniami) i wykona klastrowanie. Może to być przydatne. Kolejny punkt: czy wypróbowałeś metody, które pozwalają określić liczbę klastrów, np. podział na wykresy metodami spektralnymi (uważam, że hmetis jest taką metodą) lub spektralnym grupowaniem? (i musi być wiele innych takich metod). – micans

+0

@micans, jestem nowy w MCL i właśnie przejrzałem te slajdy: http://www.cs.ucsb.edu/~xyan/classes/CS595D-2009winter/MCL_Presentation2.pdf, gdzie mowa o parametrze mocy e', który kontroluje operację ekspansji. Nie widzę tego parametru w oficjalnym podręczniku MCL: http://micans.org/mcl/man/mcl.html#options. Czy jest to gdzieś w domyśle, jeśli nie, czy istnieje wytyczna wyboru wartości? – MLister

Powiązane problemy