Chcę wykrywać obiekty wewnątrz komórek obrazów mikroskopowych. Mam wiele obrazów z adnotacjami (około 50 000 zdjęć z obiektem i 500 000 bez obiektu).Wykrywanie obiektów na obrazach (HOG)
Do tej pory próbowałem wyodrębnić funkcje za pomocą HOG i klasyfikować za pomocą regresji logistycznej i LinearSVC. Próbowałem kilku parametrów dla HOG lub przestrzeni kolorów (RGB, HSV, LAB), ale nie widzę dużej różnicy, wskaźnik predykacji wynosi około 70%.
Mam kilka pytań. Ile obrazów należy użyć do szkolenia deskryptora? Ile zdjęć mogę użyć do przetestowania prognozy?
Próbowałem z około 1000 zdjęć do treningu, co daje mi 55% pozytywnych i 5000, co daje mi około 72% pozytywne. Jednak zależy to również bardzo od zestawu testowego, czasami zestaw testowy może osiągnąć 80-90% pozytywnie wykrytych obrazów.
Oto dwa przykłady zawierające obiekt i dwa obrazy bez obiektu:
Innym problemem jest to, czasem obrazy zawierają kilka obiektów:
powinienem próbować zwiększyć przykłady zestawu uczenia się? Jak powinienem wybrać obrazy do zestawu treningowego, po prostu losowe? Co jeszcze mogę spróbować?
Każda pomoc będzie bardzo cenna, dopiero zacząłem odkrywać uczenie maszynowe. Używam Pythona (scikit-image & scikit-learn).
Dziękuję bardzo za sugestie, są one bardzo pomocne! Szybko wypróbowałem histogramy LAB (również zasugerowane z listy mailingowej scikit-image) i wygląda na to, że dzięki kanałowi jasności uzyskuję bardzo dobre wyniki w prawidłowym wykrywaniu komórek z obiektem. Przewiduje jednak bardzo złe dla komórek bez obiektu. Z drugiej strony, aby wykryć komórki bez obiektu, HOG działał bardzo dobrze. Myślę, że połączenie obu modeli może działać (nie jestem pewien, czy to byłoby w porządku). Nadal nie sprawdzałem poprawności, więc wszystko to jest wstępne. Dziękuję za tę wskazówkę! – snowflake
Często w komórce znajdują się inne przedmioty, które są ciemno poplamione, ale nie powinny być wykrywane. Myślę, że dlatego otrzymuję wiele fałszywych alarmów, gdy używam histogramu LAB, ale nie z HOG. – snowflake
Mam jeszcze jedno pytanie, wygląda na to, że rozmiar bin odgrywa dużą rolę. Jak wybrać właściwy rozmiar pojemnika? Czy są jakieś zasady, czy raczej "spróbuj i błąd"? – snowflake