To pytanie może zostało wysłuchane, ale nie znalazłem prostej odpowiedzi na to. Stworzyłem konwój za pomocą Keras, aby sklasyfikować znaki Simpsonów (dataset here).
Mam 20 klas i podając obraz jako dane wejściowe, zwracam nazwę postaci. To całkiem proste. Mój zestaw danych zawiera zdjęcia z głównym bohaterem na zdjęciu i ma tylko nazwę postaci jako etykiety.Wykrywanie obiektów za pomocą Keras: prosty sposób na szybsze R-CNN lub YOLO
Teraz chciałbym dodać zapytanie o wykrycie obiektu, tj. Narysować obwiednię wokół znaków na obrazie i przewidzieć, która to postać. Nie chcę używać przesuwanego okna, ponieważ jest bardzo powolny. Więc pomyślałem o użyciu szybszego RCNN (github repo) lub YOLO (github repo). Czy powinienem dodać współrzędne obwiedni dla każdego zdjęcia mojego zestawu treningowego? Czy istnieje sposób na wykrywanie obiektów (i otrzymywanie obwiedni w moim teście) bez podawania współrzędnych zestawu treningowego?
Podsumowując, chciałbym stworzyć prosty model wykrywania obiektów, nie wiem, czy możliwe jest stworzenie prostszego YOLO lub Szybszego RCNN.
Dziękuję bardzo za pomoc.