2014-10-22 4 views
5

Są więc gry komputerowe Texas Hold'em, w których gra się maksymalnie 8 przeciwników, a podobno niektóre z tych gier komputerowych mówią, że prawdopodobieństwo wygranej, zakładając, że ręce przeciwnika są losowe. W przypadku, gdy ktoś nie wie, w Hold'em każdy gracz otrzymuje 2 prywatne karty, a następnie 5 kart wspólnych jest rozdawanych w środku (pierwsze 3, następnie 1, a następnie 1 więcej), a zwycięzcą jest gracz, który może ułóż najlepszą 5-kartową rękę pokerową, używając dowolnej kombinacji swoich 2 kart prywatnych i 5 kart wspólnych. W Omaha każdy gracz otrzymuje 4 prywatne karty i wciąż jest 5 kart wspólnych, a zwycięzcą jest gracz, który może zrobić najlepszy układ w 5 kartach przy użyciu 2 kart prywatnych i 3 kart wspólnych.Jak działa oprogramowanie obliczające prawdopodobieństwo wygrania Texas Hold'em lub ręki Omaha przeciwko 8 losowym przeciwnikom?

Tak więc, w Hold'em, dla prywatnej ręki danego gracza, istnieje ponad 10^24 sposobów, w jakie można rozdać prywatne ręce 8 przeciwników i 5 kart wspólnych. Jak więc obliczyć/oszacować swoje prawdopodobieństwo wygranej na początku, zakładając, że ręce Twoich 8 przeciwników są losowe? W Omaha sytuacja jest jeszcze gorsza, chociaż nigdy nie widziałem gry komputerowej Omaha, która faktycznie daje ci szanse na losowanie 8 losowych przeciwników. Ale czy są jakieś sztuczki programistyczne, które mogą sprawić, że te wygrane obliczenia prawdopodobieństwa zostaną wykonane (lub powiedz poprawne w ciągu 3 lub 4 miejsc po przecinku), szybciej niż brutalna siła? Mam nadzieję, że ktoś może tu odpowiedzieć, kto napisał taki program, zanim to potrwa wystarczająco szybko, dlatego proszę o to tutaj. Mam nadzieję, że odpowiedź nie obejmuje losowej oceny próbkowania, ponieważ zawsze istnieje mała szansa, która może być odstresowana.

Odpowiedz

5

Zidentyfikowana przewidywana stawka wygranej jest nieporęcznie dużym sumowaniem i musi być przybliżona. Standardowe podejście polega na zastosowaniu metody Monte Carlo, która polega na ciągłym symulowaniu różnych układów i przyjmowaniu średniej empirycznej: # wins/# games.

Co ciekawe, błąd (MSE) tego zbliżenia jest niezależny od konkretności (liczby kombinacji), pozwalając X = 1, jeśli wygrasz, 0 jeśli przegrasz, MSE = var (X)/N = p * (1-p)/N gdzie p = Prob (X = 1) (nieznany), a N to liczba próbek.

Istnieje cały szereg różnych technik Monte Carlo, które mogą poprawić wariancję podejścia do pobierania próbek wanilii, takie jak ważność próbkowania, typowe liczby losowe, Rwanda-czarnoprzepuszczalna, zmienne kontrolne i stratyfikowane próbkowanie, aby wymienić tylko kilka.

edytuj: widziałem, że szukasz podejścia do nieliniowego przybliżenia, wątpię, że będziesz miał dużo szczęścia w podejściach deterministycznego zbliżenia, Wiem, że obecny stan wiedzy w dziedzinie pokera Compute wykorzystuje metody Monte Carlo do obliczenia te prawdopodobieństwa, aczkolwiek z kilkoma sztuczkami redukcji wariancji.

Jeśli chodzi o "ponieważ zawsze istnieje niewielka szansa, że ​​może być daleko od" zawsze można uzyskać wysokie prawdopodobieństwo związane z poziomem błędu z nierównością Hoeffdinga.

+0

Jeśli pobieranie próbek jest aktualnym stanem wiedzy, to sądzę, że tak właśnie jest. To smutne, że nadal istnieje bardzo mała szansa, że ​​niektóre obliczone zwycięskie prognozy prawdopodobieństwa są daleko. I są (52 wybierz 2) szanse, aby tak się stało. Dzięki za twoją odpowiedź. – user2566092

+0

@ user2566092 nie ma szans, że szacunki są daleko od ciebie - możesz górną granicę tego, jeśli mamy empiryczną średnią $ m = 1/n \ sum_i X_i $, mamy od IE Hoeffdinga, że ​​Pr (| m - E [m] |> t) <= exp {-2nt^2}, ustawiając RHS = \ delta i obserwując, że X <= 1, mamy to | m - E [m] | <= sqrt (log (1/\ delta)/(2n)) + 1 * (\ delta). Biorąc pod uwagę Twoją dokładność (4 miejsca po przecinku), możesz określić wymaganą wartość dla 'n' – fairidox

+0

Zgadzam się ze wszystkim, co mówisz, ale faktem jest, że możesz oszacować, że prawdopodobieństwo wygranej wynosi 1.0, chociaż w rzeczywistości jest to więcej jak 0,5, jeśli jesteś bardzo, bardzo pechowy w próbowaniu. Wiem, że mówię o szansach, które mogą być znacznie mniejsze niż szansa na błąd obliczeniowy spowodowany promieniowaniem kosmicznym, jeśli rozmiar próbki jest wystarczająco duży. Ale wciąż istnieje szansa. Nie ma sposobu, aby za pomocą samplowania kiedykolwiek uzyskać, że szansa na duże odchylenie wynosi 0. – user2566092

0

Chciałbym użyć obliczonej wcześniej tabeli kursów zamiast obliczeń w locie. Tabele, które je wymieniają są niezwykle łatwe do znalezienia i istnieją już od jakiegoś czasu, więc są sprawdzonymi narzędziami. Byłoby całkiem proste dopasowanie twoich kart własnych + kart wspólnych do wartości procentowej wyliczonej w tabeli obliczonej z góry i natychmiastowe zwrócenie wartości do ciebie, pomijając czas obliczeń w locie.

W talii jest tylko 52 kart (klasycznie), więc jeśli po prostu znajdziesz wszystkie możliwe rozwiązania z wyprzedzeniem, szybciej jest je odczytać, zamiast przeliczać kursy dla każdej ręki w locie.

Oto link do niekompletnej tabeli kurs: http://www.learn-texas-holdem.com/texas-holdem-odds-probabilities.htm

będę myśleć o tym jak do łamania haseł. Zamiast brutalnego wymuszania każdego znaku osobno, użyj listy wspólnych haseł, aby zmniejszyć czas obliczeń. Różnica w tym przypadku polega na tym, że znasz każdą możliwą kombinację z wyprzedzeniem.

+0

Jednak nawet pre-computing wydaje się wymagać jakichś sztuczek, jeśli pożądane są dokładne prawdopodobieństwa, ponieważ dla 8 losowych rąk przeciwnika w Hold'em istnieje coś takiego jak 10^21 możliwości ignorowania przez przeciwników rozkazów przeciwników, i to idzie do 10^24 możliwości, jeśli środkowe 5 kart nie zostało jeszcze rozdane. W Omaha liczba możliwych rąk przeciwników dla 8 przeciwników jest większa o 10-20 rzędów wielkości. – user2566092

Powiązane problemy