2013-05-01 11 views
6

Mam skrypt, który sprawdza, który rekord MX należy do adresu e-mail. Mam około 300 tysięcy e-maili do sprawdzenia. Tak więc proces z pojedynczym gwintem zajmie dużo czasu.PHP/Beanstalkd: Tarło wielu pracowników równolegle

Mam beanstalkd z kolejką, a php wysyła do niego e-maile za pośrednictwem pliku. Jednak tylko ja otrzymuję jednego pracownika do wykonania kolejki. Obecnie tracę szansę na spawn i powiedz 10+ pracowników za proces.

Uruchamiam do_job_mx.php, który następnie otwiera plik, który zawiera wiadomości e-mail i przekazuje je do kolejki.

kod php do podjęcia e-maili z pliku i umieścić w kolejce - do_job_mx.php:

require_once('pheanstalk_init.php'); 

$pheanstalk = new Pheanstalk_Pheanstalk('127.0.0.1:11300'); 

$filename = '_blank.txt'; 
$filename = dirname(__FILE__) . '/in/' . $filename; 

foreach (file($filename, FILE_SKIP_EMPTY_LINES) as $line) 
{ 
    $json = json_encode(array("email" => trim($line))); 

    $pheanstalk 
     ->useTube('process_mx') 
     ->put($json); 
} 

Kod php dla pracownika - do_worker_process_mx.php:

class Worker 
{ 
    public function __construct() 
    { 
     $this->log('worker process - starting'); 

     require_once('pheanstalk_init.php'); 
     $this->pheanstalk = new Pheanstalk_Pheanstalk('127.0.0.1:11300'); 
    } 

    public function __destruct() 
    { 
     $this->log('worker process - ending'); 
    } 

    public function run() 
    { 
     $this->log('worker process - starting to run'); 

     while(1) 
     { 
      $job = $this->pheanstalk 
       ->watch('process_mx') 
       ->ignore('default') 
       ->reserve(); 

      $data = json_decode($job->getData(), true); 

      $this->process_mx($data); 

      $this->pheanstalk->delete($job); 
     } 
    } 

    private function process_mx($data) 
    { 
     $domain = explode("@", $data['email']); 

     dns_get_mx($domain[1], $mx_records); 

     $mx_array = explode(".", strtolower($mx_records[0])); 

     $mx = array_slice($mx_array, -2, count($mx_array)); 

     $mx_domain = implode(".", $mx); 

     echo $data['email'] . "\n"; 

     $this->write_file($mx_domain, $data['email']); 
    }  

    private function write_file($mx, $email) 
    { 
     $filename = fopen(dirname(__FILE__) . "/out/" . $mx . ".txt", 'ab+'); 

     fwrite($filename, $email . "\n"); 

     fclose($filename); 
    } 

    private function log($txt) 
    { 
     echo $txt . "\n"; 
    } 
} 

$worker = new Worker(); 
$worker->run(); 

Supervisord conf :

[program:do_worker_process] 
command=/usr/bin/php /srv/www/mydev/public_html/esp/do_worker_process_mx.php 
numprocs=10 
numprocs_start=10 
autostart=true 
autorestart=true 
stopsignal=QUIT 
log_stdout=true 
logfile=/var/log/supervisor/worker_process_mx.log 

Jestem obecnie w braku do spawn powiedzieć 10+ pracowników dla procesu.

Liczba uruchomionych procesów:

# supervisorctl status 

do_worker_process RUNNING pid 44343, uptime 1:46:11 

Odpowiedz

0

Centos 6 pochodzi z:

beanstalkd 1.4.6 przełożonego 2.1.8

ja po prostu potrzebne do uaktualnienia do przełożonego 3.0.

Teraz mam wiele zakładów pracy.