Powiel możliwe:
Multiple (asynchronous) connections with urllib2 or other http library?Idealna metoda wysyłania wielu żądań HTTP w Pythonie?
Pracuję na serwerze WWW Linux, który biegnie kodu Pythona chwycić w czasie rzeczywistym danych przez HTTP z 3rd party API. Dane są umieszczane w bazie danych MySQL. Potrzebuję dużo zapytań do wielu adresów URL i muszę to zrobić szybko (szybciej = lepiej). Obecnie używam urllib3 jako mojej biblioteki HTTP. Jaki jest najlepszy sposób na rozwiązanie tego problemu? Czy powinienem odradzać się wiele wątków (jeśli tak, ile?) I mieć każde zapytanie o inny adres URL? Chciałbym usłyszeć twoje przemyślenia na ten temat - dzięki!
Chcę użyć tej metody do wysyłania żądań do około 50 000 adresów URL. Czy to dobra strategia? A co z wyjątkami typu timeout itp? – John
@John Tak, jest. Odnośnie do wyjątków, zobacz parametr ['safe_mode'] (http://requests.readthedocs.org/en/latest/api/) i wydanie [953] (https://github.com/kennethreitz/requests/pull/953) –
Nie mogę wysłać więcej niż 30 żądań, używając najwyraźniej. Kiedy to zrobię, otrzymuję komunikat "Maksymalna liczba ponownych prób przekroczenia adresu URL: ..., Zbyt wiele otwartych plików". Czy mimo to można rozwiązać ten problem? – AliBZ