Pakiet "rvest" dla web scraping strony https z proxy

Chcę złom strony https, ale mi się nie udało.Pakiet "rvest" dla web scraping strony https z proxy

Oto mój kod:

require(rvest) 
url <- "https://www.sunnyplayer.com/de/" 
content <- read_html(url)

Ale mam błąd w console- "błąd w open.connection (x, "rb"): Limit czasu został osiągnięty" Jak mogę rozwiązać ten problem?

Źródło

2016-03-16 Stanislav Shlykov

Ten kod działa u mnie bezbłędnie. Problem może być związany z twoim serwerem proxy. –

Jakie ustawienie jest potrzebne w R dla proxy? plz mi pomóż. –

Wiem tylko, że zadziałało to dla mnie bez proxy. Twój tytuł wspomina, że używasz proxy, więc jeśli jest to jedyna różnica między twoją instalacją a moją, to musi to być problem. –

To samo dzieje się ze mną na proxy. Aby obejść ten problem, użyj pliku download.file i określ lokalizację pobierania. Następnie możesz sparsować plik za pomocą read_html.

download.file(url, destfile = 'C://whatever.html') 
content <- read_html('C://whatever.html')

Źródło

2016-07-19 16:06:47 Matt

Pakiet "rvest" dla web scraping strony https z proxy

Odpowiedz

Powiązane problemy