Tak, HOG może być używany do wykrywania wszelkiego rodzaju obiektów, ponieważ komputer jest pęczkiem pikseli i można wyodrębnić funkcje bez względu na ich zawartość. Inną kwestią jest jednak jego skuteczność.
HOG, SIFT, i inne tego typu ekstraktory to metody wykorzystywane do wydobywania istotnych informacji z obrazu w celu bardziej szczegółowego opisania. Gdy chcesz, aby wykryć obiekt lub osobę w obrazie z tysięcy (a może miliony) pikseli, jest to nieefektywne prostu nakarmić wektor z milionami numerów do algorytmu uczenia maszynowego jak
- to zajmie duża ilość czasu, aby zakończyć
- będzie dużo hałaśliwych informacji (tło, rozmycie, piorunami i zmiany obrotów), które nie chcemy traktować jako ważny
algorytm HOG konkretnie tworzy histogramy orientacji krawędzi z niektórych łat na obrazach. Łata może pochodzić od obiektu, osoby, bez znaczenia tła lub czegokolwiek innego i jest jedynie sposobem opisania obszaru przy użyciu informacji o krawędzi. Jak wspomniano wcześniej, informacje te można następnie wykorzystać do zasilania algorytmu uczenia maszynowego, takiego jak klasyczne maszyny wektorowe wspomagające, w celu wyszkolenia klasyfikatora zdolnego do odróżnienia jednego typu obiektu od drugiego.
Powodem, dla którego HOG odniósł tak wielki sukces w zakresie wykrywania pieszych, jest fakt, że dana osoba może znacznie różnić się kolorem, ubraniem i innymi czynnikami, ale ogólne krawędzie pieszego pozostają względnie stałe, szczególnie w okolicy nóg. Nie oznacza to, że nie można go wykorzystać do wykrywania innych typów obiektów, ale jego powodzenie może się różnić w zależności od konkretnej aplikacji. The HOG paper pokazuje szczegółowo, w jaki sposób te deskryptory mogą być używane do klasyfikacji.
Warto zauważyć, że dla wielu zastosowań, wyniki uzyskane przez HOG można znacznie poprawić za pomocą schematu piramidowego. Działa to w następujący sposób: Zamiast wyodrębniać pojedynczy obraz HOG z obrazu, można kolejno podzielić obraz (lub łatkę) na kilka podobrazów, wyodrębniając z każdej z tych mniejszych podziałów indywidualny wektor HOG. Proces można następnie powtórzyć. Ostatecznie możesz uzyskać ostateczny deskryptor, łącząc wszystkie wektory HOG w pojedynczy wektor, jak pokazano na poniższym obrazku.
Ma to tę zaletę, że w większych skalach cechy HOG zapewnić bardziej globalnej informacji, natomiast w mniejszych skalach (czyli w mniejszych podziałów) zapewniają bardziej precyzyjną szczegół. Wadą jest to, że ostateczny wektor deskryptora powiększa się, zabierając więcej czasu na wyciąganie i trenowanie z wykorzystaniem danego klasyfikatora.
W skrócie: Tak, można z nich korzystać.
To może pomóc: http://www.geocities.ws/talh_davidc/ – SomethingSomething