2014-12-10 12 views
26

Mam ten prosty parser HTML (dla celów uczenia się), że pracują nad .:Ruby open-uri przekierowanie zabronione

require 'open-uri' 
puts "Enter URL to parse HTML: " 
url = gets.chomp 
puts "Enter tag to parse from: " 
tag = gets.chomp 
response = open(url).read 
title1 = response.index(tag) 
title2 = response.index(tag.insert(1,'/')) -1 
result = response[(title1 + tag.length - 1)..title2] 
print result 

i kiedy wejście http://twitter.com, otrzymuję komunikat o błędzie:

ERROR: `open_loop': redirection forbidden: http://twitter.com -> https://twitter.com/ (RuntimeError) 
from /usr/local/rvm/rubies/ruby-2.1.4/lib/ruby/2.1.0/open-uri.rb:149:in `open_uri' 
from /usr/local/rvm/rubies/ruby-2.1.4/lib/ruby/2.1.0/open-uri.rb:704:in `open' 
from /usr/local/rvm/rubies/ruby-2.1.4/lib/ruby/2.1.0/open-uri.rb:34:in `open' 
from /home/ubuntu/workspace/htmlparse.rb:6:in `<main>' 

Dowolna porada lub pomoc? Jestem nowy w Ruby i jestem świadomy innych modułów analizowania html, ale robię to, aby nauczyć się podstaw języka Ruby. Dzięki.

+0

wierzę, że dzieje się z powodu twitter używa 'https'. FWIW - możesz chcieć trafić na stronę typu "http: // www.example.org" zamiast Twittera, jeśli tylko chcesz się uczyć i kręcić. – orde

+1

Znam 'http: //' pracę strony, ale myślałem, że open-uri automatycznie przekierowuje do https, 'https: // twitter.com' działa, ale http doesnt, czy są jakieś rozwiązania? – Vikaton

Odpowiedz

12

Możesz również złapać wyjątek, a następnie spróbuj ponownie, korzystając z adresu URL "https".

url = "http://classic.ona.io/api/v1/files/3538545?filename=gringgo/attachments/1485229166168.jpg" 

uri = URI.parse(url) 
tries = 3 

begin 
    uri.open(redirect: false) 
rescue OpenURI::HTTPRedirect => redirect 
    uri = redirect.uri # assigned from the "Location" response header 
    retry if (tries -= 1) > 0 
    raise 
end 

Źródło: https://twin.github.io/improving-open-uri/

+2

To zadziałało, klejnotów open_uri_redirections nie. –

+2

O wiele bardziej elegancka niż dodanie do niej innej zależności. – ACIDSTEALTH

+0

Genialny! Szterling, dokładnie to, czego potrzebowałem. –

Powiązane problemy