Chciałbym wyszukać profile obserwatorów użytkowników na Twitterze za pomocą R (followers> 100000). Chociaż twitteR jest świetnym pakietem, ma problemy z radzeniem sobie z wysokimi poziomami zwolenników, ponieważ trzeba wdrożyć procedurę rutynową, aby uniknąć przekroczenia limitów stawek. Jestem tu względnym nowicjuszem i zastanawiałem się, w jaki sposób można przechodzić przez obiekt ID naśladowcy, wprowadzając numery identyfikacyjne w partiach po 100 (jako że jest to maksymalna wartość, którą Twitter API może przetworzyć na raz)?Wyszukiwanie obserwatorów na Twitterze w R
Edycja: Kod dodany (twitter) biblioteki (plyr) maxTwitterIds = 100 czasspania = 500 # s
user<-getUser("[username]")
followers<-zz$getFollowerIDs()
ids_matrix = matrix(zz, nrow = maxTwitterIds, ncol = length(zz)/maxTwitterIds)
followers<-zz$getFollowerIDs()
#note: for smaller lists of followers it is possible to use the command "lookupUsers(zz) at this point
foll<-getTwitterInfoForListIds = function(id_list) {
return(lapply(id_list,
names <- sapply(foll,name)
sn<sapply(foll,screenName)
id<-sapply(foll,id)
verified<-sapply(foll,erified)
created<-sapply(foll,created)
statuses<-sapply(foll,statusesCount)
follower<-sapply(foll,followersCount)
friends<-sapply(foll,friendsCount)
favorites<-sapply(foll,favoritesCount)
location<-sapply(foll,location)
url<-sapply(foll,url)
description<-sapply(foll,description)
last_status<-sapply(foll,lastStatus)))
}
alldata = alply(, 2, function(id_set) {
info = getTwitterInfoForListIds(id_set)
Sys.sleep(sleeptime)
return(info)
})
Myślę, że na stronie 6 http://cran.r-project.org/web/packages/twitteR/twitteR.pdf można znaleźć dobre informacje. – aatrujillob
Tak, problem polega na tym, że gdy mamy do czynienia z dużymi listami obserwujących, szybko przekroczysz limity stawek, więc szukam sposobu na rozbicie bloku ID na partie o wartości 100 i uruchamianie każdego po Sys.sleep. –