2013-03-23 10 views
8

Kompiluję korpus Tweetów do analizy sentymentów i staram się przechwytywać tweety za pomocą znaków Emoji firmy Apple.Wyszukiwanie tweetów z postacią Unicode/emoji Apple?

Znalazłem Unicode na jednej z powierzchni jak: U + 1F604 (U + U + D83D DE04), UTF-8: F0 9F 98 84

Do tej pory nie były w stanie uzyskać jakiekolwiek znaczące wyniki. Jeśli przeszukuję numer \ud83d\ude04, zwrócę kilka wiadomości na Twitterze, ale nic nie pomoże. \U0001f604 nie zwraca niczego podczas wyszukiwania.

Czy jest jakiś sposób na to, abym zapytał Twittera o te postacie?

Używam wrappera Pythona-twittera dla API, ale byłbym skłonny użyć czegoś innego, jeśli istnieje lepsza alternatywa.

+0

Wiem, że jest to możliwe, ponieważ http://www.iemoji.com/ ma strumień tweetów zawierających emotikony, podnoszące nagrodę. –

Odpowiedz

3

Jest to możliwe - ale jest to nieco trudne ....

Nie można używać standardowego wyszukiwania Twitter - ale można użyć Streaming Search.

Dostępne są biblioteki open source pod adresem https://github.com/mroth/emojitrack-feeder w Ruby i Node.

5

Jak wskazuje @Terence Eden, wyszukiwarka api REST dla wyszukiwarek Twitter nie działa ze znakami emoji, ale interfejs API przesyłania strumieniowego działa (od stycznia 2016 r.).

Istnieje kilka narzędzi do uzyskania dostępu do funkcji API Twittera w pythonie. Ten, którego najczęściej używam, to tweepy. Można go zainstalować z pip.

The tweepy docs on setting up the streaming api są dość łatwe do naśladowania. Łańcuchy, które filtrujesz, muszą zawierać rzeczywiste znaki emoji (np .: '').

Należy zauważyć, że to wyszukuje emotikony jako "słowa": czyli w otoczeniu białych znaków. Coś takiego jak "free" nie zostanie znalezione!

+0

Bardzo dziwne. Zauważyłem to sam. Masz pomysł, dlaczego streaming może to zrobić, ale nie szuka? W każdym razie ta odpowiedź powinna zostać zaakceptowana przez PO. – sudo

Powiązane problemy