Mam plik wejściowy z listą ~ 50000 klastrów i obecnością wielu czynników w każdym z nich (~ 10 milionów wpisów ogółem), zobacz mniejszy przykład poniżej:Schemat Venna z listy klastrów i współwystępujących czynników
set.seed(1)
x = paste("cluster-",sample(c(1:100),500,replace=TRUE),sep="")
y = c(
paste("factor-",sample(c(letters[1:3]),300, replace=TRUE),sep=""),
paste("factor-",sample(c(letters[1]),100, replace=TRUE),sep=""),
paste("factor-",sample(c(letters[2]),50, replace=TRUE),sep=""),
paste("factor-",sample(c(letters[3]),50, replace=TRUE),sep="")
)
data = data.frame(cluster=x,factor=y)
przy odrobinie pomocy z innym pytaniem, mam go do produkcji PieChart dla współwystępowania czynników takich jak to:
counts = with(data, table(tapply(factor, cluster, function(x) paste(as.character(sort(unique(x))), collapse='+'))))
pie(counts[counts>1])
Ale teraz chciałbym mieć diagram venna dla współwystępowania czynników. Idealnie, również w sposób, który może przyjąć próg dla minimalnej liczby dla każdego czynnika. Na przykład diagram venna dla różnych czynników, tak aby każdy z nich musiał być obecny n> 10 w każdym skupieniu, które należy wziąć pod uwagę.
Próbowałem znaleźć sposób na zliczanie stołów z agregatem, ale nie mogłem go uruchomić.
Pan spojrzał na każdy z pakietów R dla diagramów Venna? Zobacz [ten ostatni przykład] (http://stats.stackexchange.com/questions/16802/derive-pc-ab-from-coxs- two-rules/18209 # 18209) autorstwa G. Jay Kerns przy użyciu biblioteki 'venneuler' lub ten krótki artykuł w Journal of Stat Software korzystający z biblioteki 'venn' ([Murdoch, 2004] (http://www.jstatsoft.org/v11/c01)). Jeśli chodzi wyłącznie o programowanie w języku R, należy je zmigrować do SO. –
Avilella, to pytanie może nie uzyskać żadnych odpowiedzi, ponieważ jest marginalnie wyłączone. Możesz zrobić lepiej na SO, który ma aktywną społeczność użytkowników R. Ale nie przesyłaj dalej: po prostu oznacz to pytanie moderatorem, jeśli chcesz je przenieść. – whuber
Oznacziłem to flagą, ale nie widzę jeszcze przeniesienia do SO ... – 719016