2013-04-09 14 views
9

następujący kod:500 Błąd z urllib.request.urlopen

req = urllib.request.Request(url=r"http://borel.slu.edu/cgi-bin/cc.cgi?foirm_ionchur=im&foirm=Seol&hits=1&format=xml",headers={'User-Agent':' Mozilla/5.0 (Windows NT 6.1; WOW64; rv:12.0) Gecko/20100101 Firefox/12.0'}) 
    handler = urllib.request.urlopen(req) 

daje mi następujący wyjątek:

Traceback (most recent call last): 
    File "C:/Users/Foo/lang/old/test.py", line 46, in <module> 
    rip() 
    File "C:/Users/Foo/lang/old/test.py", line 36, in rip 
    handler = urllib.request.urlopen(req) 
    File "C:\Python32\lib\urllib\request.py", line 138, in urlopen 
    return opener.open(url, data, timeout) 
    File "C:\Python32\lib\urllib\request.py", line 375, in open 
    response = meth(req, response) 
    File "C:\Python32\lib\urllib\request.py", line 487, in http_response 
    'http', request, response, code, msg, hdrs) 
    File "C:\Python32\lib\urllib\request.py", line 413, in error 
    return self._call_chain(*args) 
    File "C:\Python32\lib\urllib\request.py", line 347, in _call_chain 
    result = func(*args) 
    File "C:\Python32\lib\urllib\request.py", line 495, in http_error_default 
    raise HTTPError(req.full_url, code, msg, hdrs, fp) 
urllib.error.HTTPError: HTTP Error 500: Internal Server Error 

ale to działa dobrze w przeglądarce, co ten problem?

+2

Co ciekawe, jeśli połowu wyjątek i nazywają '.read()' na tym, masz dokumentu XML, który wygląda jak sukces odpowiedź. –

+2

Po prostu zawsze odpowiada stanem 500, również w przeglądarkach. –

Odpowiedz

11

Serwer jest raczej b0rken. Odpowiada również błędowi 500 w przeglądarce .

można złapać wyjątek i nadal czytać odpowiedź:

import urllib.request 
from urllib.error import HTTPError 

req = urllib.request.Request(url=r"http://borel.slu.edu/cgi-bin/cc.cgi?foirm_ionchur=im&foirm=Seol&hits=1&format=xml",headers={'User-Agent':' Mozilla/5.0 (Windows NT 6.1; WOW64; rv:12.0) Gecko/20100101 Firefox/12.0'}) 
try: 
    handler = urllib.request.urlopen(req) 
except HTTPError as e: 
    content = e.read() 
+2

Jeśli jesteś podobny do mnie i otrzymałeś komunikat o błędzie, że nie zdefiniowano adresu urllib.error, a używasz adresu urllib2, zamiast tego wpisz 'from urllib2 import HTTPError' – streetlogics

Powiązane problemy