2013-06-18 14 views
7

HOG jest popularny w wykrywaniu ludzi. Może służyć do wykrywania na przykład obiektów takich jak kubek na obrazie.Histogram wykrywanych obiektów gradientowych

Przykro mi, że nie zadawałem pytania programistycznego, ale mam na myśli pomysł, czy mogę użyć funkcji Hog do wydobywania obiektów obiektu.

Zgodnie z moimi badaniami, przez kilka dni nie czuję się tak, ale nie jestem pewien.

+0

To może pomóc: http://www.geocities.ws/talh_davidc/ – SomethingSomething

Odpowiedz

29

Tak, HOG może być używany do wykrywania wszelkiego rodzaju obiektów, ponieważ komputer jest pęczkiem pikseli i można wyodrębnić funkcje bez względu na ich zawartość. Inną kwestią jest jednak jego skuteczność.

HOG, SIFT, i inne tego typu ekstraktory to metody wykorzystywane do wydobywania istotnych informacji z obrazu w celu bardziej szczegółowego opisania. Gdy chcesz, aby wykryć obiekt lub osobę w obrazie z tysięcy (a może miliony) pikseli, jest to nieefektywne prostu nakarmić wektor z milionami numerów do algorytmu uczenia maszynowego jak

  1. to zajmie duża ilość czasu, aby zakończyć
  2. będzie dużo hałaśliwych informacji (tło, rozmycie, piorunami i zmiany obrotów), które nie chcemy traktować jako ważny

algorytm HOG konkretnie tworzy histogramy orientacji krawędzi z niektórych łat na obrazach. Łata może pochodzić od obiektu, osoby, bez znaczenia tła lub czegokolwiek innego i jest jedynie sposobem opisania obszaru przy użyciu informacji o krawędzi. Jak wspomniano wcześniej, informacje te można następnie wykorzystać do zasilania algorytmu uczenia maszynowego, takiego jak klasyczne maszyny wektorowe wspomagające, w celu wyszkolenia klasyfikatora zdolnego do odróżnienia jednego typu obiektu od drugiego.

Powodem, dla którego HOG odniósł tak wielki sukces w zakresie wykrywania pieszych, jest fakt, że dana osoba może znacznie różnić się kolorem, ubraniem i innymi czynnikami, ale ogólne krawędzie pieszego pozostają względnie stałe, szczególnie w okolicy nóg. Nie oznacza to, że nie można go wykorzystać do wykrywania innych typów obiektów, ale jego powodzenie może się różnić w zależności od konkretnej aplikacji. The HOG paper pokazuje szczegółowo, w jaki sposób te deskryptory mogą być używane do klasyfikacji.

Warto zauważyć, że dla wielu zastosowań, wyniki uzyskane przez HOG można znacznie poprawić za pomocą schematu piramidowego. Działa to w następujący sposób: Zamiast wyodrębniać pojedynczy obraz HOG z obrazu, można kolejno podzielić obraz (lub łatkę) na kilka podobrazów, wyodrębniając z każdej z tych mniejszych podziałów indywidualny wektor HOG. Proces można następnie powtórzyć. Ostatecznie możesz uzyskać ostateczny deskryptor, łącząc wszystkie wektory HOG w pojedynczy wektor, jak pokazano na poniższym obrazku.

Pyramidal HOG

Ma to tę zaletę, że w większych skalach cechy HOG zapewnić bardziej globalnej informacji, natomiast w mniejszych skalach (czyli w mniejszych podziałów) zapewniają bardziej precyzyjną szczegół. Wadą jest to, że ostateczny wektor deskryptora powiększa się, zabierając więcej czasu na wyciąganie i trenowanie z wykorzystaniem danego klasyfikatora.

W skrócie: Tak, można z nich korzystać.