Chciałbym powielić funkcje, które wykorzystuje Facebook, aby przeanalizować łącze. Kiedy przesyłasz link do swojego statusu na Facebooku, ich system wychodzi i pobiera sugerowaną title
, summary
i często jedną lub więcej odpowiednich image
s z tej strony, z której możesz wybrać miniaturkę.Pobieranie streszczeń łącza podobnego do Facebooka (tytuł, podsumowanie, odpowiednie obrazy) przy użyciu Pythona
Moja aplikacja musi to zrobić za pomocą Pythona, ale jestem otwarty na wszelkiego rodzaju poradniki, posty na blogu lub doświadczenia innych programistów, które się z tym wiążą i mogą mi pomóc dowiedzieć się, jak to osiągnąć. .
naprawdę chciałbym się nauczyć z doświadczeń innych ludzi przed tylko skoki w
Żeby było jasne, gdy dany adres URL strony internetowej, chcę być w stanie odzyskać:
- Tytuł: Prawdopodobnie tylko tag
<title>
, ale prawdopodobnie<h1>
, nie jestem pewien. - Jedno-podsumowanie podsumowania strony.
- Kilka odpowiednich obrazów, które mogłyby zostać użyte jako miniatura. (Najtrudniejsze jest odfiltrowanie zbędnych obrazów takich jak banery lub zaokrąglonymi rogami)
może trzeba zaimplementować to sam, ale ja przynajmniej chcą wiedzieć o tym, jak inni ludzie robili tego rodzaju zadań.
BeautifulSoup nie jest dobrze obsługiwany w Pythonie 3.1, a jego oryginalny autor nie robi już wiele rozwoju. Prawdopodobnie lepiej użyj lxml.html i/lub html5lib (ten drugi jest polecany przez autora BeautifulSoup). – lunaryorn
Dobrze wiedzieć, aby móc z niego skorzystać w przyszłości. Dzięki! –