Mój skrypt Perl potrzebuje do uruchomienia wielu wątków jednocześnie ...Jak zaimplementować komunikację wątków semaforów w Perlu?
use threads ('yield', 'exit' => 'threads_only');
use threads::shared;
use strict;
use warnings;
no warnings 'threads';
use LWP::UserAgent;
use HTTP::Request;
use HTTP::Async;
use ...
... i takie wątki muszą uzyskać pewne informacje z sieci, więc HTTP::Async
służy.
my $request = HTTP::Request->new;
$request->protocol('HTTP/1.1');
$request->method('GET');
$request->header('User-Agent' => '...');
my $async = HTTP::Async->new(slots => 100,
timeout => REQUEST_TIMEOUT,
max_request_time => REQUEST_TIMEOUT);
Ale niektóre wątki potrzebują dostępu do sieci tylko, gdy inny wątek (s) tak mówi.
my $start = [Time::HiRes::gettimeofday()];
my @threads =();
foreach ... {
$thread = threads->create(
sub {
local $SIG{KILL} = sub { threads->exit };
my $url = shift;
if ($url ...) {
# wait for "go" signal from other threads
}
my ($response, $data);
$request->url($url);
$data = '';
$async->add($request);
while ($response = $async->wait_for_next_response) {
threads->yield();
$data .= $response->as_string;
}
if ($data ...) {
# send "go" signal to waiting threads
}
}
}, $_);
if (defined $thread) {
$thread->detach;
push (@threads, $thread);
}
}
Nie może być jeden lub więcej wątków czeka na sygnał „go” i nie może być jeden lub więcej wątków, że taki sygnał „go” może wysyłać. Na początku stan semafora to "wait", a gdy zmieni się na "przejdź do", pozostanie tak.
Wreszcie aplikacja sprawdza maksymalny czas pracy. Jeśli wątki działają zbyt długo, wysyłany jest sygnał samoczynnego zakończenia.
my $running;
do {
$running = 0;
foreach my $thread (@threads) {
$running++ if $thread->is_running();
}
threads->yield();
} until (($running == 0) ||
(Time::HiRes::tv_interval($start) > MAX_RUN_TIME));
$running = 0;
foreach my $thread (@threads) {
if ($thread->is_running()) {
$thread->kill('KILL');
$running++;
}
}
threads->yield();
Teraz do rzeczy. Moje pytania to:
Jak mogę najefektywniej kod oczekiwania „semafor” w skrypcie (patrz komentarze w skrypcie powyżej). Czy powinienem po prostu użyć właśnie udostępnionej zmiennej z jakąś obcą pętlą
sleep
?Czy muszę dodać trochę
sleep
pętlę na końcu aplikacji, aby dać czas do gwintu do samozniszczenia?
Czy dobrze rozumiem, że używasz oddzielnego HTTP :: obiektów asynchroniczny (kopiowane, nie jest dzielona przez nowych wątków), aby pobrać co najwyżej jeden adres URL w danym momencie na wątek? – pilcrow
@pilcrow - Tak, to wygląda. Czy to marnotrawstwo zasobów? –
Może być, ale nie musi, mniej pamięci lub czasu, ale jest to naprawdę drenaż w cyklach programatora. :) Projekt jest trudny do zrozumienia, a więc być może do zmiany/rozszerzenia bezpiecznie, ponieważ komponenty nie wydają się całkiem poprawne. – pilcrow