Próbuję zapisać wynik polecenia przeszukiwania scrapy, które wypróbowałem scrapy crawl someSpider -o some.json -t json >> some.text
Ale to nie zadziałało ... czy jakieś ciało może mi powiedzieć, w jaki sposób mogę zapisać wyjście do tekstu plik .... mam na myśli dzienniki i informacje drukowane przez scrapy ...Jak zapisać indeksowanie Scrapy Wyjście komendy
6
A
Odpowiedz
9
Musisz przekierować stderr też. Przekierowujesz tylko standardowe wyjście. można przekierować go jakoś tak:
scrapy crawl someSpider -o some.json -t json 2> some.text
Kluczem jest numer 2, który „wybiera” stderr jako źródło przekierowania.
Jeśli chcesz przekierować zarówno stderr i stdout do jednego pliku, można użyć:
scrapy crawl someSpider -o some.json -t json &> some.text
Więcej informacji na temat wyjścia przekierowania: http://tldp.org/HOWTO/Bash-Prog-Intro-HOWTO-3.html
9
Możesz dodać te linie do swojego settings.py
:
LOG_STDOUT = True
LOG_FILE = '/tmp/scrapy_output.txt'
A następnie normalnie rozpocznij indeksowanie:
scrapy crawl someSpider
0
jeśli chcesz uzyskać dane wyjściowe z polecenia runspider.
scrapy runspider scraper.py -o some.json -t json 2> some.text
To działa również.
Powiązane problemy
- 1. Scrapy - Indeksowanie całej witryny
- 2. Błędy komendy Scrapy Benchmark/Benchmark
- 3. Standardowe komendy WPF - gdzie jest wyjście?
- 4. Jak zapisać wyjście błędów gcc do pliku
- 5. Jak zapisać wyjście pliku AUGraph do pliku?
- 6. W jaki sposób potokować wyjście procesu do komendy rejestratora i komendy head?
- 7. partia REGEX wyjście komendy zapytania reg do zmiennej
- 8. częściowe indeksowanie mysql, indeksowanie wsteczne
- 9. Uruchom dwie komendy z crontabem
- 10. Scrapy Shell i Scrapy Splash
- 11. dynamic start_urls in scrapy
- 12. Jak przyspieszyć indeksowanie OpenGrok
- 13. Jak zrestartować Scrapy pająka
- 14. Indeksowanie Internetu
- 15. Czy można zapisać wyjście str w obiekcie R?
- 16. Jak przechowywać wyjście recv()?
- 17. Indeksowanie PostgreS?
- 18. Jak włączyć indeksowanie w Xcode?
- 19. jak zaimplementować zagnieżdżony element w scrapy?
- 20. Octave, jak zapisać wykres wykresu?
- 21. Przeciek pamięci pająka Scrapy
- 22. Jak zrobić wyjście GCC na standardowe wyjście?
- 23. Keras: jak zapisać historię szkoleniowych
- 24. Jak wyświetlić listę plików za pomocą komendy sort, ale nie komendy ls -lrt
- 25. Indeksowanie kolumny wyrażenie MATLAB
- 26. Wyjątki samouczek Scrapy
- 27. Komendy wbudowane WPF
- 28. Komendy komend Vima
- 29. Komendy Selenium WebDriverJs
- 30. Ponowne indeksowanie po pandas.drop_duplicates
Sprawdź [link] (http://doc.scrapy.org/en/latest/topics/logging.html#logging-settings), aby uzyskać więcej ustawień rejestrowania. Możesz nawet użyć funkcji "scrapy crawl" MyCrawler -s LOG_FILE =/var/log/crawler_mycrawler.log ", aby zmienić ustawienia przeszukiwacza w locie. – pista329