Jak udowodnić, że generator liczb losowych jest lepszy od drugiego?

Jak udowodnisz, że jeden RNG jest lepszy od innego?Jak udowodnić, że generator liczb losowych jest lepszy od drugiego?

Nie mam na myśli czasu działania, ale raczej ilości entropii "wygenerowanej" - która również rzuca pojęcie periodyczności (niski okres = niska entropia).

Czy można udowodnić, że RNG jest optymalny? Czy jest to nieosiągalny cel? Optymalnie, każda sekwencja jest równie prawdopodobna i niezależna od przeszłych lub przyszłych wyników.

Jestem zainteresowany algorytmów, nie kosmiczne urządzenia do pobierania próbek tła lub innych źródeł fizycznego „przypadkowości” (jest to losowe lub po prostu skomplikowane?)

Źródło

2010-12-29 John Shedletsky

Jestem prawie pewien, że nie ma sposobu na udowodnienie "optymalnej" przypadkowości. – Gabe

http://pl.wikipedia.org/wiki/Statistical_randomness#Tests –

NIST dostarcza dokumentację i oprogramowanie do testowania losowości RNG: http://csrc.nist.gov/groups/ST/toolkit/rng/index.html. Dokument jest tutaj i opisuje 15 różnych testów RNG: http://csrc.nist.gov/groups/ST/toolkit/rng/documents/SP800-22rev1a.pdf – indiv

Stary Standard Badań używany być "testami Diehard". http://en.wikipedia.org/wiki/Diehard_tests Zostało to zastąpione przez testy NIST wskazane przez DKnight: http://csrc.nist.gov/groups/ST/toolkit/rng/index.html. Artykuł wiki Dieharda daje dobry przegląd tego, na co patrzysz. Bit NIST będzie wymagał nieco więcej kopania.

Jak można stwierdzić, nie można potwierdzić optymalnego pseudo RNG (algorytmu). Wszystkie mają wartość początkową i zależą od danych wejściowych w celu wygenerowania wartości. Jeśli znasz ziarno i stan, znasz następną wartość. Na przykład sprawdź http://en.wikipedia.org/wiki/Mersenne_twister. Najbardziej podoba mi się to z powodu niesamowitej nazwy, ale artykuł dobrze sprawdza się w wyjaśnieniach zasad PRNG.

Źródło

2010-12-29 18:31:34

Zobacz http://www.random.org/analysis/

jeden i tylko optymalną RNG:

RFC 1149.5 specifies 4 as the standard IEEE-vetted random number.

Źródło

2010-12-29 18:06:00 marcog

Generowanie sekwencji liczb, a następnie spróbuj je skompresować. Im bardziej losowe, tym mniej będzie kompresji. Czysta losowość jest nieściśliwa. Byłoby interesujące zobaczyć wyniki i jeśli będą różnice.

Źródło

2010-12-29 18:07:17 ja72

To zależy bardzo od algorytmu kompresji. Podejrzewam, że większość algorytmów kompresji nie jest wystarczająco "inteligentna", aby skompresować nawet złe sekwencje liczb losowych. Z drugiej strony łatwo jest skompresować wiele zupełnie losowych sekwencji. Cyfry w pi są uważane za losowe, ale bycie kompresją tej sekwencji jest trywialne. – pafcu

Zobacz odpowiedź @ marcoga. Kto ma powiedzieć, że na 1 000 000 przejazdów zarobienie 1.000.000 4 jest mniej przypadkowe niż jakiekolwiek inne. Mniej * prawdopodobnie * wyniki nie oznaczają mniej * losowe * – asawyer

@asawyer Prawda. Ale myślę, że każdy test losowości da ci zły wynik, gdy zostanie przedstawiony 10^6 równych liczb ...: D –

Narodowy Instytut Standardów i Technologii ma jakieś dobre informacje na ten temat:

http://csrc.nist.gov/groups/ST/toolkit/rng/index.html

Wygląda na to, że jest to zestaw testów i dużo dobrego materiału referencyjnego

Źródło

2010-12-29 18:12:22 DKnight

Istnieje obiektywna definicja z teorii złożoności obliczeniowej: asymptotyczna złożoność czasu wymagana do odróżnienia danych wyjściowych od danych losowych.

Dobry PRNG powinien zmusić sprzedawcę do poświęcenia znacznie więcej czasu w miarę wzrostu wielkości materiału siewnego lub w miarę wzrostu wymaganego poziomu pewności. (Z nasion stałym rozmiarze Przypuszczam, że jeśli spojrzeć na rzeczywisty czas pracy, jak i złożoności programu.)

Dla porównania jeden PRNG przeciw drugiemu, jeden z mniejszych/szybszego Wyróżnikiem jest gorzej.
Jednym z powszechnych założeń, chociaż nie zostało to udowodnione, jest to, że niektóre PRNG są nieodróżnialne od losowych w czasie wielomianowym. To jedno możliwe znaczenie dla "optymalnego".
Testy statystyczne, takie jak diehard tests, to tylko proste wyróżniki.

Źródło

2010-12-29 19:11:14

Podstawy są w Knuth, The Art of Computer Programming Vol 2, "Algorytmy seminumeryczne".Chodzi o to, aby opracować testy przypadkowości, w których każdy test będzie próbował znaleźć nielosowe aspekty PRNG. Zauważ, że to, co może wydawać się przypadkowe dla istoty ludzkiej, nie jest. Na przykład, mamy tendencję do stwierdzenia, że sekwencja "1,4,4,1" na przykład jest nie-losowa, podczas gdy może występować idealnie w większej losowej sekwencji.

więc podejście jest grubsza:

znaleźć różne testy dla losowości, to zasadniczo zagorzałych i NIST grup testowych.
Wykonaj wymienione testy na PRNG.
Jeśli PRNG nie przejdzie jednego lub więcej testów, może być postrzegany jako słabszy PRNG niż te, które przeżyją.

Fajnym przykładem testu jest analiza fazy i przestrzeni. Tu jest link o to stracony kilka lat wstecz na generatorach TCP losowości dla różnych systemów operacyjnych:

http://lcamtuf.coredump.cx/oldtcp/tcpseq.html

Inne testy są klasyczne chi-kwadraty, Komolgorov-Smirnoff etc, wszystko wyjaśnione w Knuth. Dobre PRNG przetrwają każdy możliwy atak na nich.

Źródło

2010-12-29 21:11:09

Jak udowodnić, że generator liczb losowych jest lepszy od drugiego?

Odpowiedz

Powiązane problemy