Pracuję nad Androidem Project dotyczącym Optical Music Recognition. Wykonuję zdjęcie nuty za pomocą kamery mobilnej i staram się rozpoznać notatki i symbole. Jestem bardzo zaznajomiony z metodologią po wstępnym przetwarzaniu, ale tego rodzaju praca jest zwykle wykonywana za pomocą skanera. (zamiast tego muszę użyć kamery mobilnej)Wykrywanie linii na muzycznym obrazie arkusza w Androidzie
Intuicyjnie użyłem transformacji hough, aby najpierw wykryć pięciolinie (linie prętów), następnie obliczyć kąt między nimi a osią poziomą i obrócić obraz tak, jak kąt. Mogłoby to działać teoretycznie, ale pojawienie się segmentów linii i kąt tych segmentów nie są spójne. Tak więc to nie zadziałało (być może z powodu efektu perspektywy).
Potem próbowałem wielu algorytmów rozpoznawania krawędzi i liniowego, ale żaden z nich nie działał stabilnie. (w tym obracanie domeny częstotliwości i detektory segmentów linii)
Teraz mam na myśli nowe podejście podobne do skanerów dokumentów na Androida. Próbuję przekształcić mój obraz w formę, taką jak zeskanowany dokument. Chcę dopasować mój obraz do osi poziomej i pozbyć się efektu z powodu nachylenia i perspektywy.
Zastanawiam się, czy ktoś ma pojęcie o tym, jak osiągnąć to "skanowanie dokumentów". Lub jeśli masz jakieś pojęcie o wyrównywaniu dokumentu lub stabilnym wykrywaniu linii, byłoby to więcej niż pomocne dla mojej przyszłej pracy. Dziękuję Ci.
[blog] (http://gaut.am/making-an-ocr-android-app-using-tesseract/) może lub nie może być pomocne –
Jeśli jesteś chętny do korzystania z Javy, możesz sprawdzić http://audiveris.kenai.com/, silnik Open Optical Music Recognition (ujawnienie: od dawna byłem krótko współpracownikiem). – btown
@JasonRobinson: Byłoby pomocne dla projektu OCR, ale nie dla tego, wierzę, dziękuję i tak. –