Przeczytałem wiele odpowiedzi dotyczących skrobania w Internecie, które mówią o BeautifulSoup, Scrapy e.t.c. wykonać skrobanie w Internecie.Nieodłączny sposób na zapisanie źródła strony internetowej
Czy istnieje sposób na zachowanie równoważnika zapisania źródła strony z przeglądarki internetowej?
To znaczy, czy w Pythonie istnieje sposób na wskazanie go na stronie internetowej i pobranie go w celu zapisania źródła strony do pliku tekstowego za pomocą standardowych modułów Pythona?
Tu muszę:
import urllib
f = open('webpage.txt', 'w')
html = urllib.urlopen("http://www.somewebpage.com")
#somehow save the web page source
f.close()
Niewiele wiem - ale patrząc na kod faktycznie ciągnąć źródło strony więc mogę to napisać. Rozumiem, że urlopen właśnie nawiązuje połączenie.
Być może istnieje odpowiednik readlines() dla czytania linii strony internetowej?
Witamy na przepełnienie stosu! Zachęcamy do [badania swoich pytań] (http://stackoverflow.com/questions/how-to-ask). Jeśli [próbowałeś już czegoś] (http://whathaveyoutried.com/), dodaj to pytanie - jeśli nie, najpierw zbadaj i spróbuj najpierw odpowiedzieć na twoje pytanie, a potem wróć. –
Dzięki! Nadal jestem bardzo nowy na stronie, więc przepraszam, jeśli podszedłem do tego w niewłaściwy sposób. Dodam kod, skąd mam :) –