2011-07-18 20 views
11

Chcę śledzić linki za pomocą strumieniowego API. Idealnie chciałbym zdefiniować "http://twitter.com" i uzyskać wszystkie statusy zawierające ten URL, oba skrócone (na przykład http://bit.ly/reXnK3) i pełne (http://twitter.com/dev/api/help.html). W jaki sposób mogę to osiągnąć? Obecnie wygląda na to, że metoda "track" nie obsługuje adresów URL. Czy może czegoś brakuje?Jak śledzić adresy URL za pomocą Twitter Streaming API

PS: Wiem o Search API i o BackType, ale wolałbym używać Streaming API, ponieważ jest on w czasie rzeczywistym i nie ma ograniczeń szybkości.

Odpowiedz

2

Parametr ścieżki znajduje się w statuses/filter, a wynik zapytania powinien zdecydowanie zawierać łącza, jeśli łącza znajdują się w tweecie. This to przykład tego, co otrzymujesz ze strumienia. Myślę, że Twoim problemem jest to, że interfejs API do przesyłania strumieniowego nie pozwala na śledzenie adresów URL jako takich, ale pozwala śledzić słowa kluczowe lub użytkowników według identyfikatora użytkownika. Czy URL, który próbujesz śledzić, jest powiązany z jakimś rodzajem słowa kluczowego? Czy możesz zanalizować adres URL i użyć - powiedzmy - zarówno nazwy domeny, jak i konkretnego identyfikatora URI jako oddzielnych słów kluczowych (na przykład: w przypadku http://twitter.com/dev/api/help.html, następujące słowa kluczowe mogą pomóc: twitter.com, dev, api)? To, co dostajesz z tą strategią, ma w sobie dużo "szumu", ale możesz przechowywać wyniki w bazie danych, a następnie wyszukiwać cały URL, który próbujesz śledzić. documentation o metodzie „Track” jest następujący:

tekście tweeta i niektóre pola podmiotu są uważane za meczów. W szczególności atrybut tekstowy Tweet, expanded_url i display_url dla linków i mediów, tekst dla hashtagów i nazwa_skrzyń dla wzmianek o użytkownikach są sprawdzane pod kątem zgodności.

Nigdy nie testowałem interfejsu API do przesyłania strumieniowego i nie czuję się lepiej z interfejsem API wyszukiwania, ale obie powinny zdecydowanie dawać podobne wyniki. Spróbuj powiększyć listę słów kluczowych rozdzielanych przecinkami, dodaj adres URL, który chcesz śledzić, jako dwa słowa kluczowe (jeden dla nazwy domeny, jeden dla konkretnego identyfikatora URI), a powinieneś dostać coś bliskiego temu, co próbujesz osiągać. Przynajmniej tak bym zrobił, gdybym miał ten problem, na podstawie tego, co mówi Twitter w dokumentacji.

Powiązane problemy