Wykrywanie obiektów za pomocą Keras: prosty sposób na szybsze R-CNN lub YOLO

To pytanie może zostało wysłuchane, ale nie znalazłem prostej odpowiedzi na to. Stworzyłem konwój za pomocą Keras, aby sklasyfikować znaki Simpsonów (dataset here).
Mam 20 klas i podając obraz jako dane wejściowe, zwracam nazwę postaci. To całkiem proste. Mój zestaw danych zawiera zdjęcia z głównym bohaterem na zdjęciu i ma tylko nazwę postaci jako etykiety.Wykrywanie obiektów za pomocą Keras: prosty sposób na szybsze R-CNN lub YOLO

Teraz chciałbym dodać zapytanie o wykrycie obiektu, tj. Narysować obwiednię wokół znaków na obrazie i przewidzieć, która to postać. Nie chcę używać przesuwanego okna, ponieważ jest bardzo powolny. Więc pomyślałem o użyciu szybszego RCNN (github repo) lub YOLO (github repo). Czy powinienem dodać współrzędne obwiedni dla każdego zdjęcia mojego zestawu treningowego? Czy istnieje sposób na wykrywanie obiektów (i otrzymywanie obwiedni w moim teście) bez podawania współrzędnych zestawu treningowego?

Podsumowując, chciałbym stworzyć prosty model wykrywania obiektów, nie wiem, czy możliwe jest stworzenie prostszego YOLO lub Szybszego RCNN.

Dziękuję bardzo za pomoc.

Źródło

2017-06-21 A. Attia

Celem yolo lub szybszego rcnn jest uzyskanie obwiedni. Krótko mówiąc, musisz oznaczyć dane, by je wyszkolić.

Na skróty:

1) etykieta garść ograniczające pola dla (powiedzmy 5 na znak).
2) Trenuj szybciej rcnn lub yolo na bardzo małym zbiorze danych.
3) Uruchom swój model z pełnym zestawem danych
4) Będzie to trochę dobrze, wiele z nich źle.
5) Trenuj szybszy rcnn na tych, które są poprawnie ograniczone, twój zestaw treningowy powinien być teraz znacznie większy.
6) Powtarzaj, aż uzyskasz pożądany efekt.

Źródło

2017-08-09 18:42:33

Być może już mieć odpowiednią architekturę na uwadze już „Teraz chciałbym dodać wykrywanie obiektów zapytaj tj narysować obwiednię wokół bohaterów obrazu i przewidzieć, która postać jest”

Więc po prostu podzielić zadanie na dwie części:
1. Dodać detektor do wykrywania obiektów osoba powrócić obwiedni
2. Klasyfikować obrys pomocą convnet już wyszkolonego

dla części 1 ty sh byłoby dobrze przejść przy użyciu detektora funkcji (na przykład konwoju z pretekstem na COCO lub Imagenet) z wykrywaczem obiektów (nadal YOLO i Faster-RCNN), aby wykryć ludzi. Jednak może się okazać, że ludzie w "kreskówkach" (powiedzmy Simpsonowie to ludzie) nie są właściwie rozpoznawani, ponieważ wykrywacz obiektów nie jest przeszkolony w zakresie obrazów opartych na kreskówkach, ale na prawdziwych obrazach. W takim przypadku możesz spróbować ponownie wytrenować kilka warstw detektora obiektów na rysunkach kreskówek, aby nauczyć się funkcji rysunkowych, zgodnie z metodologią transfer learning.

Źródło

2018-03-07 18:26:47 Michelagio

Wykrywanie obiektów za pomocą Keras: prosty sposób na szybsze R-CNN lub YOLO

Odpowiedz

Powiązane problemy