Mnożenie wektora z podmatrycami jest powolne

Mam wysoką macierz (przykład poniżej to 10000 na 3000) i chcę wziąć produkty wewnętrzne z podzbiorem jej wierszy (np. 500 wierszy). Powtarza się to z różnymi losowo wybranymi wierszami wiele razy (100 razy w przykładzie, ale w rzeczywistości wiele razy). Okazuje się, że indeksowanie jest dość powolne. W moim przykładzie lepiej jest pomnożyć pełną macierz A (tj. 10000 wierszy) zamiast selektywnie wybierać i mnożyć 500, które są rzeczywiście potrzebne.Mnożenie wektora z podmatrycami jest powolne

Losowe generowanie indeksów wierszy (sub = randperm(10000);sub = sub(1:500);) jest tanie obliczeniowo; Umieściłem go w obu pętlach, aby być sprawiedliwym.

A=randn(10000,3000); 
g=zeros(10000,1); 

tic 
for i=1:100 
    sub = randperm(10000); sub = sub(1:500); 
    b=randn(3000,1); 
    g(sub) = g(sub) + A(sub,:)*b; 
end 
toc 
% elapsed time is 1.58 sec 

tic 
for i=1:100 
    sub = randperm(10000); sub = sub(1:500); 
    b=randn(3000,1); 
    g = g + A*b; 
end 
toc 
% elapsed time is 1.28 sec

Pytanie brzmi: czy istnieje sposób na przyspieszenie rzeczy, gdy faktycznie potrzebny jest tylko podzbiór wierszy?

Źródło

2013-07-26 Yannisdoc

Nic nie ma wspólnego z pytaniem, ale z 'sub = randperm (10000); sub = sub (1: 500); 'jest taki sam jak tylko' sub = randperm (10000,500); '. Może zaoszczędzić ci mikrosekundę:/ – Dan

Chociaż nie jest to dokładnie twoje pytanie, możesz znaleźć ten [ostatni wpis na blogu] (http://blogs.mathworks.com/loren/2013/05/04/recent-question-about-speed- z-subarray-obliczeniami /) z interesującego MathWorks. Innym powodem spowolnienia podczas indeksowania jest to, że 'A' musi" ocenić "' sub' w sposób zbliżony do tego, co robi funkcja przed kontynuowaniem. – horchler

Używanie 'randperm' zmieniło się wraz z wersjami matlab, więc instrukcje tutaj są kompatybilne ze starszymi wersjami. –

Spróbuj pomnożyć przez wiersze zamiast kolumn. Może to wymagać zmiany kolejności danych lub zastosowania skalarnej transpozycji (.') lub dwóch, ale ponieważ jest to natywna forma tablic, możesz uzyskać zaskakujące przyspieszenie. Na przykład zamiana wymiary od A i g:

A = randn(3000,10000); 
g = zeros(1,10000); 

tic 
for i = 1:100 
    sub = randperm(10000,500); % Taking @Dan's suggestion 
    b = randn(1,3000);   % b is now a row vector 
    g(sub) = g(sub)+b*A(:,sub); % multiply across rows instead 
end 
toc

można transponować wyjście, jeśli zajdzie taka potrzeba. Na moim komputerze jest to ponad 50% szybciej niż w pierwszym przypadku.

Wierzę, że przynajmniej jednym z powodów jest to, że BLAS/LAPACK może użyć w tym przypadku loop unrolling.

Źródło

2013-07-26 14:53:13 horchler

Fantastyczny wynik. Na mojej maszynie poprawa prędkości wynosi x10. –

Mnożenie wektora z podmatrycami jest powolne

Odpowiedz

Powiązane problemy