2016-03-16 13 views
5

Chcę złom strony https, ale mi się nie udało.Pakiet "rvest" dla web scraping strony https z proxy

Oto mój kod:

require(rvest) 
url <- "https://www.sunnyplayer.com/de/" 
content <- read_html(url) 

Ale mam błąd w console- "błąd w open.connection (x, "rb"): Limit czasu został osiągnięty" Jak mogę rozwiązać ten problem?

+0

Ten kod działa u mnie bezbłędnie. Problem może być związany z twoim serwerem proxy. –

+0

Jakie ustawienie jest potrzebne w R dla proxy? plz mi pomóż. –

+0

Wiem tylko, że zadziałało to dla mnie bez proxy. Twój tytuł wspomina, że ​​używasz proxy, więc jeśli jest to jedyna różnica między twoją instalacją a moją, to musi to być problem. –

Odpowiedz

7

To samo dzieje się ze mną na proxy. Aby obejść ten problem, użyj pliku download.file i określ lokalizację pobierania. Następnie możesz sparsować plik za pomocą read_html.

download.file(url, destfile = 'C://whatever.html') 
content <- read_html('C://whatever.html') 
Powiązane problemy