2017-06-21 31 views
6

To pytanie może zostało wysłuchane, ale nie znalazłem prostej odpowiedzi na to. Stworzyłem konwój za pomocą Keras, aby sklasyfikować znaki Simpsonów (dataset here).
Mam 20 klas i podając obraz jako dane wejściowe, zwracam nazwę postaci. To całkiem proste. Mój zestaw danych zawiera zdjęcia z głównym bohaterem na zdjęciu i ma tylko nazwę postaci jako etykiety.Wykrywanie obiektów za pomocą Keras: prosty sposób na szybsze R-CNN lub YOLO

Teraz chciałbym dodać zapytanie o wykrycie obiektu, tj. Narysować obwiednię wokół znaków na obrazie i przewidzieć, która to postać. Nie chcę używać przesuwanego okna, ponieważ jest bardzo powolny. Więc pomyślałem o użyciu szybszego RCNN (github repo) lub YOLO (github repo). Czy powinienem dodać współrzędne obwiedni dla każdego zdjęcia mojego zestawu treningowego? Czy istnieje sposób na wykrywanie obiektów (i otrzymywanie obwiedni w moim teście) bez podawania współrzędnych zestawu treningowego?

Podsumowując, chciałbym stworzyć prosty model wykrywania obiektów, nie wiem, czy możliwe jest stworzenie prostszego YOLO lub Szybszego RCNN.

Dziękuję bardzo za pomoc.

Odpowiedz

5

Celem yolo lub szybszego rcnn jest uzyskanie obwiedni. Krótko mówiąc, musisz oznaczyć dane, by je wyszkolić.

Na skróty:

  • 1) etykieta garść ograniczające pola dla (powiedzmy 5 na znak).
  • 2) Trenuj szybciej rcnn lub yolo na bardzo małym zbiorze danych.
  • 3) Uruchom swój model z pełnym zestawem danych
  • 4) Będzie to trochę dobrze, wiele z nich źle.
  • 5) Trenuj szybszy rcnn na tych, które są poprawnie ograniczone, twój zestaw treningowy powinien być teraz znacznie większy.
  • 6) Powtarzaj, aż uzyskasz pożądany efekt.
0

Być może już mieć odpowiednią architekturę na uwadze już „Teraz chciałbym dodać wykrywanie obiektów zapytaj tj narysować obwiednię wokół bohaterów obrazu i przewidzieć, która postać jest

Więc po prostu podzielić zadanie na dwie części:
1. Dodać detektor do wykrywania obiektów osoba powrócić obwiedni
2. Klasyfikować obrys pomocą convnet już wyszkolonego

dla części 1 ty sh byłoby dobrze przejść przy użyciu detektora funkcji (na przykład konwoju z pretekstem na COCO lub Imagenet) z wykrywaczem obiektów (nadal YOLO i Faster-RCNN), aby wykryć ludzi. Jednak może się okazać, że ludzie w "kreskówkach" (powiedzmy Simpsonowie to ludzie) nie są właściwie rozpoznawani, ponieważ wykrywacz obiektów nie jest przeszkolony w zakresie obrazów opartych na kreskówkach, ale na prawdziwych obrazach. W takim przypadku możesz spróbować ponownie wytrenować kilka warstw detektora obiektów na rysunkach kreskówek, aby nauczyć się funkcji rysunkowych, zgodnie z metodologią transfer learning.

Powiązane problemy