W jaki sposób można używać HMM do rozpoznawania pisma ręcznego?

Problem jest nieco inny niż tradycyjne rozpoznawanie pisma ręcznego. Mam zestaw danych, które są tysiące następujących. Dla jednej narysowanej postaci mam kilka kolejnych współrzędnych (x, y), w których pióro było wciśnięte. Jest to problem sekwencyjny (czasowy).W jaki sposób można używać HMM do rozpoznawania pisma ręcznego?

Chcę być w stanie klasyfikować odręczne znaki na podstawie tych danych i chciałbym wprowadzić HMM do celów edukacyjnych. Ale czy to właściwe podejście? Jak można to wykorzystać?

Źródło

2012-02-21 zebra

To naprawdę ciekawy pomysł. Z ciekawości, jest również współrzędna czasowa każdego zapisanego punktu (tak, że w milisekundie 1 współrzędna 30 x 45 została naciśnięta) lub są one po prostu w kolejności? – Turnsole

Obecnie jest to sekwencyjne. Zastanawiasz się nad dynamicznym dopasowywaniem czasu, aby wyjaśnić, że postacie są rysowane wolniej/szybciej – zebra

Myślę, że to właściwe podejście. Jako ćwiczenie możesz zacząć od rozpoznawania alfabetu [palm graffite] (http://en.wikipedia.org/wiki/Graffiti_%28Palm_OS%29). – Maurits

Ten problem jest rzeczywiście mieszanka dwóch problemów:

uznając jeden znak z danych
rozpoznających słowo z (głośno) sekwencji znaków

HMM służy do znalezienia najbardziej prawdopodobnej sekwencji skończonej liczby dyskretnych stanów z głośnych pomiarów. Jest to dokładnie problem 2, ponieważ głośne pomiary stanów dyskretnych a-z, 0-9 następują kolejno w sekwencji.

Dla problemu 1, HMM jest bezużyteczny, ponieważ nie interesuje cię podstawowa sekwencja. To, czego chcesz, to wzmocnienie odręcznej cyfry informacjami o tym, jak ją napisałeś.

Osobiście zacznę od wprowadzenia standardowego, nowoczesnego rozpoznawania pisma ręcznego, które już jest bardzo dobre (z splotowymi sieciami neuronowymi lub głębokim uczeniem się). Następnie możesz dodać informacje o tym, jak zostało napisane, na przykład zgodnie z ruchem wskazówek zegara/przeciwnie do ruchu wskazówek zegara.

Źródło

2012-03-04 14:17:31

Myślę, że HMM może być używany w obu problemach wymienionych przez @ jens. Pracuję także nad pismem online, a HMM jest używany w wielu artykułach. Najprostsze podejście jest następujące:

Wybierz funkcję.
Jeśli wybrana funkcja jest ciągła, przekonwertuj ją na dyskretną.
Wybierz parametry HMM: topologia i liczba stanów.
Modele pociągu za pomocą HMM. jeden model dla każdej klasy.
Test z użyciem zestawu testów.

dla każdej pozycji:

najprostsza funkcja jest kąt wektora łączącego kolejne punktów. Możesz użyć bardziej skomplikowanych funkcji, takich jak kąty wektorów uzyskane przez Douglasa & Algorytm Peucker.
Najprostszym sposobem na dyskretyzację jest używanie kodów Freemana, ale można również użyć algorytmów klastra, takich jak k-średnie i GMM.
Topologie HMM: Ergodic, Left-Right, Bakis and Linear. # stanów można uzyskać przez błąd próbny &. Parametry HMM mogą być zmienne dla każdego modelu dla . Liczba obserwacji jest określana poprzez dyskretyzację. Próbki obserwacji mogą mieć zmienną długość.
Polecam Kevin Murphy HMM przybornik.
Powodzenia.

Źródło

2012-07-14 12:02:34 Hadi

W jaki sposób można używać HMM do rozpoznawania pisma ręcznego?

Odpowiedz

Powiązane problemy