Chcę włączyć niektóre protokoły http dla niektórych pająków i wyłączyć je dla innych pająków.Jak ustawić różne ustawienia scrapy dla różnych pająków?
Czy mogę zrobić coś takiego?
# settings.py
proxy_spiders = ['a1' , b2']
if spider in proxy_spider: #how to get spider name ???
HTTP_PROXY = 'http://127.0.0.1:8123'
DOWNLOADER_MIDDLEWARES = {
'myproject.middlewares.RandomUserAgentMiddleware': 400,
'myproject.middlewares.ProxyMiddleware': 410,
'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': None
}
else:
DOWNLOADER_MIDDLEWARES = {
'myproject.middlewares.RandomUserAgentMiddleware': 400,
'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': None
}
Jeśli powyższy kod nie działa, czy są jakieś inne sugestie?
To nie to, co użytkownik chce zrobić, istnieją pewne przypadki, w których chcesz kilka pająków w samym projekcie. – rajat