Używam Ruby, Selenium WebDriver i Nokogiri do pobierania danych ze stron internetowych. Po załadowaniu prawidłowego kodu HTML wydrukuję zawartość pewnej klasy.Czy można użyć bota do otwarcia przeglądarki, ręcznie manipulować stroną, a następnie nadal używać bota?
Na przykład
require "selenium-webdriver"
require "nokogiri"
browser = Selenium::WebDriver.for :chrome
browser.get "https://jsfiddle.net"
doc = Nokogiri::HTML.parse(browser.page_source)
doc.css('.aiButton').map(&:text).join(',')
Znalazłem zdecydowanie najtrudniejsza część jest uzyskanie poprawnego HTML załadowany prawidłowo. Na przykład treść, którą chcę, może być ukryta przez niektóre javascript lub może znajdować się na innej stronie.
Czy można użyć Selenium do załadowania strony, a następnie ręcznie manipulować stroną, aby wyświetlić prawidłowy kod HTML, a następnie , a następnie zezwolić botowi na dokończenie i wydrukowanie treści, do której ma się on przydać?
krótka odpowiedź brzmi tak. Selenium otworzy przeglądarkę w twoim GUI i pozostanie otwarta do czasu ukończenia twojego skryptu. –