2011-12-14 19 views
5

próbuję zrobić prosty asynchronicznej klienta HTTP z asyncore: Ten kod działa poprawnie i wyjście (szybko wystarczających):asyncore pyton wisi

www.gmail.com : recv http code: 301 
www.yandex.ru : recv http code: 200 
www.python.org : recv http code: 200 
www.google.ru : recv http code: 200 
www.gravatar.com : recv http code: 302 
www.com.com : recv http code: 302 
www.yahoo.com : recv http code: 302 
www.bom.com : recv http code: 301 

But niż ja Odkomentuj linia ze nie istnieje host:

#c = AsyncHTTP('http://www.no-such-host.ru') #!this line breaks execution! 

przerwy wykonania, kod zawiesza na jakiś czas, część wyjście danych i zawiesza się bez ostatniego wyjścia danych:

connection error: [Errno -5] No address associated with hostname 
www.gmail.com : recv http code: 301 
www.yandex.ru : recv http code: 200 
www.yahoo.com : recv http code: 302 
www.com.com : recv http code: 302 
www.bom.com : recv http code: 301 
www.gravatar.com : recv http code: 302 

... niektóre hosty są tutaj tracone, a duże opóźnienie na starcie.

Dlaczego tak się dzieje i jak to naprawić?

# coding=utf-8 
import asyncore 
import string, socket 
import StringIO 
import mimetools, urlparse 

class AsyncHTTP(asyncore.dispatcher): 
    # HTTP requestor 

    def __init__(self, uri): 
     asyncore.dispatcher.__init__(self) 

     self.uri = uri 


     # turn the uri into a valid request 
     scheme, host, path, params, query, fragment = urlparse.urlparse(uri) 
     assert scheme == "http", "only supports HTTP requests" 
     try: 
      host, port = string.split(host, ":", 1) 
      port = int(port) 
     except (TypeError, ValueError): 
      port = 80 # default port 
     if not path: 
      path = "/" 
     if params: 
      path = path + ";" + params 
     if query: 
      path = path + "?" + query 

     self.request = "GET %s HTTP/1.0\r\nHost: %s\r\n\r\n" % (path, host) 

     self.host = host 
     self.port = port 

     self.status = None 
     self.header = None 
     self.http_code = None 
     self.data = "" 

     # get things going! 
     self.create_socket(socket.AF_INET, socket.SOCK_STREAM) 
     #self.connect((host, port)) 
     #return 
     try: 
      self.connect((host, port)) 
     except Exception,e: 
      self.close() 
      self.handle_connect_expt(e) 

    def handle_connect(self): 
     self.send(self.request) 

    def handle_expt(self): 
     print "handle_expt error!" 
     self.close() 

    def handle_error(self): 
     print "handle_error error!" 
     self.close() 

    def handle_connect_expt(self,expt): 
     print "connection error:",expt 

    def handle_code(self):   
     print self.host," : ","recv http code: ",self.http_code 


    def handle_read(self): 
     data = self.recv(2048) 
     #print data 
     if not self.header: 
      self.data = self.data + data 
      try: 
       i = string.index(self.data, "\r\n\r\n") 
      except ValueError: 
       return # continue 
      else: 
       # parse header 
       fp = StringIO.StringIO(self.data[:i+4]) 
       # status line is "HTTP/version status message" 
       status = fp.readline() 
       self.status = string.split(status, " ", 2) 
       self.http_code = self.status[1] 
       self.handle_code()  

       # followed by a rfc822-style message header 
       self.header = mimetools.Message(fp) 
       # followed by a newline, and the payload (if any) 
       data = self.data[i+4:] 
       self.data = "" 
       #header recived 
       #self.close() 


    def handle_close(self): 
     self.close() 




c = AsyncHTTP('http://www.python.org') 
c = AsyncHTTP('http://www.yandex.ru') 
c = AsyncHTTP('http://www.google.ru') 
c = AsyncHTTP('http://www.gmail.com') 
c = AsyncHTTP('http://www.gravatar.com') 
c = AsyncHTTP('http://www.yahoo.com') 
c = AsyncHTTP('http://www.com.com') 
c = AsyncHTTP('http://www.bom.com') 
#c = AsyncHTTP('http://www.no-such-host.ru') #!this line breaks execution! 
asyncore.loop() 

ps: Mój system Ubuntu 11.10 + python 2.7.2

+0

Wypróbowałem twój skrypt na moim systemie linuxowym (nie ubuntu), i działa bez żadnego zgłoszonego problemu. Prawdopodobnie musi być jakiś problem z twoją konfiguracją ubuntu. – ekhumoro

+0

@ekhumoro: Pomyliłem się, przepraszam, nawet próbowałem tego kodu i pracuję bez żadnych problemów :) – codersofthedark

Odpowiedz

4

można powołać blokującej rozpoznawania nazw, gdy robisz self.connect((host, port)). W połączeniu z twoją lokalną konfiguracją DNS, dlatego twój program ma duże opóźnienie przy starcie.

Alternatywą dla asyncore i samodzielnego samodzielnego rozpoznawania nazw, może być użycie Twisted. Interfejs konfiguracyjny połączenia Twisted TCP (głównie reactor.connectTCP lub jeden z wbudowanych interfejsów API) nie jest blokowany. Więc naiwne korzystanie z niego pozostanie poprawnie asynchroniczne.