2013-04-03 10 views
5

Jestem nowy w uczeniu maszynowym. Czytając o Supervised Learning, Unsupervised Learning, Reinforcement Learning Natknąłem się na pytanie jak poniżej i wpadłem w zakłopotanie. Proszę pomóż mi w określeniu w poniżej trzech, które z nich to Uczenie nadzorowane, Uczenie bez nadzoru, Uczenie ze wzmocnieniem.Nadzorowane uczenie się, (ii) Uczenie bez nadzoru, (iii) Zbrojenie Dowiedz się

Jakie typy uczenia się, jeśli w ogóle, najlepiej opisują następujące trzy scenariusze:

(i) system klasyfikacji moneta jest tworzony za pomocą automatu. Aby to zrobić, programiści uzyskują dokładne dane monet z amerykańskiej mennicy i wyprowadzają statystyczny model rozmiaru, wagi i nazwy, który maszyna automatowa używa następnie do klasyfikacji swoich monet.

(ii) Zamiast dzwonić do Mennicy Stanów Zjednoczonych w celu uzyskania informacji o monetach, algorytmem jest przedstawiony z dużym zestawem oznaczonych monet. Algorytm korzysta z tych danych do określać granice decyzyjne, które automat sprzedający następnie używa do sklasyfikowania swoich monet .

(iii) Komputer opracowuje strategię gry w kółko i krzyżyk, grając wielokrotnie i dostosowując swoją strategię, penalizując ruchy, które ostatecznie prowadzą do przegranej.

+3

To brzmi jak domowej. Jeśli tak, powinien być odpowiednio oznaczony. –

+3

http://a1.phobos.apple.com/us/r30/CobaltPublic/v4/bd/c2/2a/bdc22a17-0243-30a9-ff33-f4c64a0b23ca/205-2184361167323353073-CS156_Problem_Set_1_Telecourse.pdf#!116627291 –

+0

@LarsKotthoff , tag pracy domowej został przestarzały. –

Odpowiedz

2

Załóżmy, że masz zbiór danych reprezentowany jako macierz X. Każdy wiersz w X jest obserwacją (instancją), a każda kolumna reprezentuje określoną zmienną (cechę).

Jeśli masz również (i używasz) wektora y etykiet, odpowiadających obserwacjom, to jest to zadanie nadzorowanego uczenia się. W grę wchodzi "nadzorca", który mówi, które obserwacje należą do klasy # 1, która do klasy # 2, itp.

Jeśli nie masz etykiet do obserwacji, musisz podjąć decyzję na podstawie samego zbioru danych X . Na przykład w przykładzie z monetami możesz zbudować model rozkładu normalnego dla parametrów monet i stworzyć system, który sygnalizuje, kiedy moneta ma nietypowe parametry (a tym samym można próbować oszustwa). W tym przypadku nie masz żadnego nadzorcy, który by powiedział, jakie monety są w porządku, a co oznacza próbę oszustwa. Zatem jest to nienadzorowane zadanie uczenia się.

W dwóch poprzednich przykładach najpierw przeszkolono model, a następnie użyto go, bez żadnych dalszych zmian w modelu. W modelu zbrojenia uczenie model jest stale ulepszany na podstawie przetworzonych danych i wyniku. Na przykład robot, który chce znaleźć drogę od punktu A do punktu B, może najpierw obliczyć parametry ruchu, następnie przesunąć w oparciu o te parametry, następnie przeanalizować nową pozycję i zaktualizować parametry ruchu, aby następny ruch był bardziej dokładny (powtórzenie aż dojdziesz do punktu B).

Na tej podstawie jestem pewien, że będziesz w stanie znaleźć korespondencję między tymi 3 rodzajami nauki a przedmiotami.

+0

nadzorowane uczenie się – user2201536

3

(i) bez nadzoru learning - jak nie oznaczone dane są dostępne

(ii) nadzorowane uczenie się - jak już oznakowane dane dostępne

(iii) wzmocnienie learning- gdzie się uczyć i uczyć się na nowo na podstawie działania i efekty/korzyści z tych działań.

+0

(ii) "algorytm przedstawiony jest z dużym zestawem ** oznaczonych ** monet" – ffriend

+2

(i) nie jest bez nadzoru: znany jest prawdziwy rozkład danych. Oznacza to, że możesz uzyskać regułę optymalnej decyzji Bayesa. Brak etykietowanych danych -> bez nadzoru jest zbyt prostą regułą, myślę, że poprawna odpowiedź musi być "żadna z powyższych". Aby być bez nadzoru, trzeba by było przedstawić kilka monet, ale nie ma informacji, które instancje należały do ​​jakich typów. –

+0

Zgadzam się, ale jeśli tylko jedna metoda musi zostać wybrana z trzech podanych metod, myślę, że powinna to być nauka bez nadzoru, ponieważ nie ma informacji pod ręką (etykiety) – marc

0

W nadzorowanych algorytmach, klasy są z góry określone. Klasy te można pojmować jako skończony zestaw, uprzednio przez człowieka. W praktyce pewien segment danych będzie oznaczony tymi klasyfikacjami. Zadaniem uczącego się maszyny jest poszukiwanie wzorców i konstruowanie modeli matematycznych. Modele te są następnie oceniane na podstawie ich zdolności prognostycznej w odniesieniu do miar wariancji samych danych. Wiele metod wymienionych w dokumentacji (indukcja drzewa decyzyjnego, naiwny Bayes, itp.) To przykłady nadzorowanych technik uczenia się.

Bez nadzoru uczniowie nie są klasyfikowani. W rzeczywistości podstawowym zadaniem uczenia bez nadzoru jest automatyczne tworzenie etykiet klasyfikacyjnych. Nieobsługiwane algorytmy szukają podobieństwa między fragmentami danych, aby określić, czy można je scharakteryzować jako grupę. Grupy te nazywane są klastrami i istnieje cała rodzina technik uczenia maszynowego skupiających się na klastrach.

+0

Dobre wyjaśnienie, ale brakuje ci uczenia się wzmacniania. – 0xc0de

0

Napisałem artykuł o Perceptronie dla nowicjuszy. Wyjaśniłem uczenie się nadzorowane w szczegółach za pomocą zasady delty. Opisano także uczenie się bez konieczności nadzorowania i uczenie się przez wzmocnienie (w skrócie). Możesz sprawdzić, czy jesteś zainteresowany.

"Intuicyjny Przykład Artificial Neural Network (Perceptron) Wykrywanie Samochody/Piesi z self-samochód napędzany"

https://www.spicelogic.com/Blog/Perceptron-Artificial-Neural-Networks-10

Powiązane problemy