Mam data.frame z 1000 wierszy i 3 kolumny. Zawiera dużą liczbę duplikatów, a ja użyłem plyr, aby połączyć duplikaty wierszy i dodać liczbę dla każdej kombinacji, jak wyjaśniono w this thread.Zlokalizuj i scal duplikaty wierszy w data.frame, ale ignoruj kolejność kolumn
Oto przykład tego, co mam teraz (I nadal mieć oryginalną data.frame ze wszystkich duplikatów czy muszę zacząć stamtąd):
name1 name2 name3 total
1 Bob Fred Sam 30
2 Bob Joe Frank 20
3 Frank Sam Tom 25
4 Sam Tom Frank 10
5 Fred Bob Sam 15
Jednak kolejność kolumn nie materia. Chcę tylko wiedzieć, ile wierszy ma te same trzy wpisy, w dowolnej kolejności. Jak mogę połączyć wiersze zawierające te same wpisy, ignorując zamówienie? W tym przykładzie chciałbym połączyć wiersze 1 i 5 oraz wiersze 3 i 4.
To również działało (po usunięciu spacji z wpisów data.frame). Eliminuje to również krok ręcznego kopiowania/wklejania danych. Jednak to pozostawia mnie: 'nazwa1 nazwa2 NAME3 całkowity odnośnika newtotal' 1 Sam Bob Fred 30 Fred Bob ~ ~ Sam 45 2 Bob Joe Frank 20 Bob ~ Frank ~ Joe 20 3 Frank Sam Tom 25 Frank ~ Sam ~ Tom 35' – jdfinch3
Hmmm, nie można uzyskać bloku kodu do pracy w komentarzach ... jednak ee wyświetla połączone wyniki bez zaktualizowanych sum, a następnie obok połączonych wyników ze zaktualizowanymi sumami (i z ~ zamianą zakładki między wierszami). Jestem pewien, że jest to łatwa poprawka, ale nie wiem wystarczająco dobrze (jeszcze), aby ją łatwo naprawić ... – jdfinch3
OK, rzeczywiście poświęciłem czas na przeczytanie twojego kodu i pomyśl o każdej akcji i zdałem sobie sprawę, że odpowiedź na moje pytanie była jeszcze bardziej oczywista, niż myślałem. Właśnie wziąłem dwie nowe kolumny i wstawiłem je do nowego data.frame (i zastąpiłem "~" przez "" tylko po to, aby ułatwić czytanie). Dzięki! – jdfinch3