Mam fragment zdań i chcę zbudować nieukierunkowaną listę krawędzi współwystąpienia słowo i zobaczyć częstotliwość każdej krawędzi. Przyjrzałem się pakietowi tm
, ale nie znalazłem podobnych funkcji. Czy mogę użyć jakiegoś pakietu/skryptu? Wielkie dzięki!budować listę współwystępującą słowo słowo w R
Uwaga: słowo nie występuje razem z nim samym. Słowo, które pojawia się dwa lub więcej razy, występuje razem z innymi wyrazami tylko raz w tym samym zdaniu.
DF:
sentence_id text
1 a b c d e
2 a b b e
3 b c d
4 a e
5 a
6 a a a
WYJŚCIE
word1 word2 freq
a b 2
a c 1
a d 1
a e 3
b c 2
b d 2
b e 2
c d 2
c e 1
d e 1
@ TylerRinker thanks! Dokładnie wynik powinien pozostać taki sam, ponieważ wiersz 5 ma tylko "a", a w wierszu 6 "a" nie występuje sam ze sobą. – leoce