2012-12-23 15 views
18

Mam problem z wyodrębnianiem automatycznych napisów z filmów z YouTube.Wyodrębnij automatyczne napisy z YouTube wideo

Próbowałem użyć metody http://video.google.com/timedtext?type=track&v=3wszM2SA12E&name=Automatic&lang=en, ale ta działa tylko dla tych filmów, które nazywają ścieżki. Na przykład, to nie ma żadnych utworów nazwanych automatyczny (tylko podpis) i nie ładuje się: rrkrvAUbU9Y

Istnieje kilka web-aplikacje, które obecnie nie może zrobić (jak http://www.serpsite.com/youtube-subtitles-download-tool/ i http://mo.dbxdb.com/), ale Potrzebuję skryptu, ponieważ chcę go wykorzystać do moich badań.

Ktoś ma jakieś pomysły, jaki jest właściwy sposób, aby to uzyskać? Interfejs API YouTube ma coś wspólnego z podpisami, ale tylko dla zarejestrowanych użytkowników, podczas gdy powyższe aplikacje działają dla wszystkich filmów i wątpię, czy przechwytują kod HTML ze strony (chociaż jest to możliwe). Musi być jakiś sposób ... proszę o pomoc!

+1

Co jest powodem, że nie będzie korzystał z API jako zarejestrowany użytkownik? – Drifter

+0

@Drifter: Pytasz o to tak, jakby posiadanie konta YouTube było prawami przysługującymi wszystkim. To, że ją masz, nie oznacza, że ​​każdy może ją mieć. Wiele osób jest prawnie zabronionych korzystania z konta YouTube _do życia._ Inne są arbitralnie odmawiane rejestracji bez powodu. Inni już mają dość kont w innych miejscach i nie mogą zarządzać więcej; prowadzenie mandatów i posiadanie konta to zarówno ciężar, jak i odpowiedzialność. Inni nie mają ochoty na bycie monitorowanym. – 7vujy0f0hy

Odpowiedz

1

Świetny sposób na uzyskanie danych ze strony za pomocą file_get_contents jednak działa tylko , jeśli wideo ma przycisk "CC" lub napisy, ale kiedy to zrobi można uzyskać wszystkie elementy tekstowe z xml plik niestety udokumentowany przez jedną z usług "Youtube to caption" stwierdził, że potrzebuje napisów włączonych przez youtuber, aby uzyskać napisy, więc niestety nie można uzyskać napisów z filmów bez włączonego "CC", jednak jeśli nadal chcesz, możesz użyć file_get_contents na plik xml znajduje wszystkie znaczniki "tekstowe", a następnie przekształca je w napisy.

1

trzeba zadzwonić inny pierwszy API: http://video.google.com/timedtext?type=list&v=3wszM2SA12E

To da ci listę dostępnych ścieżek. W twoim przypadku można uzyskać tylko jedną ścieżkę: id="0" name="Automatic" lang_code="en" lang_original="English" lang_translated="English" lang_default="true"

W tym konkretnym filmie mogę kierować utwór tylko przez kilka powodów z powodu name=Automatic. Ale na innym filmie to działało w porządku:

http://video.google.com/timedtext?type=track&v=zenMEj0cAC4&id=0&lang=en

Powiązane problemy