Możesz wyodrębnić dane z tej strony za pomocą robota lub za pomocą wyciągu masowego. Powyższa strona internetowa wykorzystuje bardzo proste formy paginacji:
http://www.cityoflondon.gov.uk/events/Pages/default.aspx
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37
Oto zbiór danych, który stworzyłem dla powyższych adresów URL, które powinno zawierać wszystkie istotne informacje.
319aebad-88ea-4053-a649-2087011ce041
Jeśli masz dalsze pytania o indywidualnej stronie internetowej, prosimy o kontakt [email protected]
Dzięki! Meg
Znalazłem ten kurs na [Udemy] (https://www.udemy.com/how-to-extract-data-from-the-web) i naprawdę pomogło mi zrozumieć Import.io , zwłaszcza na wykładzie 3, gdzie wyjaśnia więcej o Crawler. – Huander