mam matrycę około 1000 rzędzie X 500 zmiennym, staram się nawiązać macierz korelacji dla tych zmiennych z nazwami zamiast numerów, więc wynik powinien wyglądać następującomacierz korelacji z nazwami
variable1 variable2 variable3 variable4 ...
mrv1 mrv2 mrv3 mrv4 ...
smrv1 smrv2 smrv3 smrv4 ...
. . . .
. . . .
. . . .
gdzie mrv1 = Najczęściej związana zmienna do zmiennej1, smrv1 = druga najbardziej powiązana zmienna i tak dalej.
W rzeczywistości stworzyłem macierz korelacji, ale używając pętli for i bardzo skomplikowanego polecenia (prawdopodobnie najgorszego polecenia wszech czasów, ale tak naprawdę działa!). Nie mogę się doczekać, aby ustalić to poprzez odpowiednie polecenie, oto polecenie, którego teraz używam.
mydata <- read.csv("location", header=TRUE, sep=",")
lgn <- length(mydata)
crm <- cor(mydata)
k <- crm[,1]
K <- data.frame(rev(sort(k)))
A <- data.frame(rownames(K))
for (x in 2:lgn){
k <- crm[,x]
K <- data.frame(rev(sort(k)))
B <- data.frame(rownames(K))
A <- cbind(A,B)
}
Jakieś pomysły na prostsze, bardziej niezawodne polecenia?
Dzięki,
Czy to pomocne ?: http://stackoverflow.com/questions/6782070/display-correlation-tables-as-descending-list/6782814#6782814 – GSee