nie mam konkretnego problemu kodu po prostu nie wiem, jak zbliżyć się do następującego problemu logistycznie z ramami Scrapy:Scrapy: Śledź link, aby uzyskać dodatkowe dane przedmiotu?
Struktura danych chcę zeskrobać jest zazwyczaj wiersz tabeli dla każdej pozycji . Wystarczy wystarczająco, prawda?
Docelowo chcę zeskrobać Tytuł, odejdą i Szczegóły dla każdego wiersza. Tytuł i odejdą są natychmiast dostępne na stronie ...
ALE Szczegóły sami nie są w tabeli - ale raczej, link do strony zawierającej dane (jeśli nie robi „t sensu oto tabela):
|-------------------------------------------------|
| Title | Due Date |
|-------------------------------------------------|
| Job Title (Clickable Link) | 1/1/2012 |
| Other Job (Link) | 3/2/2012 |
|--------------------------------|----------------|
Obawiam się, że nadal nie wiem jak to logistycznie przekazać przedmiot wokół z wywołań zwrotnych i wniosków, nawet po przeczytaniu przez CrawlSpider części Scrapy dokumentacja.
Czy istnieje podstawowy przykładowy kod gdzieś? – fortuneRice
@fortuneRice, nie wiesz, czy przykłady są aktualne: http://stackoverflow.com/questions/11150053 http://stackoverflow.com/questions/13910357/how-can-i-use-multiple-requests-and -pass-items-in-between-them-in-scrapy-python/13911764 # 13911764 – warvariuc
jest to odpowiednia część dokumentacji: http://doc.scrapy.org/en/latest/topics/spiders.html – tback