Próbuję wyodrębnić litery z planszy do projektu. Obecnie mogę wykryć planszę gry, posegmentować ją na poszczególne kwadraty i wyodrębnić obrazy z każdego kwadratu.Dokładna klasyfikacja obrazu binarnego
Wejście Dostaję jest tak (są to poszczególne litery):
Początkowo byłem licząc liczbę czarnych pikseli na obrazie i przy użyciu tego jako sposób na identyfikację różnych liter, które działały nieco dobrze dla kontrolowanych obrazów wejściowych. Problem jednak polega na tym, że nie mogę zrobić tego dla obrazów, które różnią się od nich nieznacznie.
Mam około 5 próbek z każdej litery do pracy na szkolenia, które powinny być wystarczająco dobre.
Czy ktoś wie, jaki byłby dobry algorytm do tego celu?
Moje pomysły były (po normalizacji obrazu):
- Liczenie różnicę między obrazem a każda litera obrazek, aby zobaczyć, który produkuje najmniejszą ilość błędów. Nie będzie to jednak działać w przypadku dużych zestawów danych.
- Wykrywanie narożników i porównywanie względnych lokalizacji.
- ???
Każda pomoc zostanie doceniona!
Witamy w OCR. – delnan
Heh, wypróbowałem Tessearact na testowych obrazach po ich rozszerzeniu, ale nie udało się to marnie (nawet po ustawieniu trybu segmentacji na "jedno słowo"). OCR wydaje się przesadą dla tego konkretnego przypadku, IMO, ponieważ obrazy są bardzo podobne w każdym przypadku. – Blender
co z niezmiennością skali i rotacji? – moooeeeep