DZIEKAN i RADA WYDZIAŁU ELEKTROTECHNIKI, AUTOMATYKI, INFORMATYKI i INŻYNIERII BIOMEDYCZNEJ AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE | |
---|---|
zapraszają na publiczną dyskusję nad rozprawą doktorską mgra inż. Mateusza Barana |
|
ROZPOZNAWANIE WZORCÓW W GRAFACH SUPERPIKSELOWYCH | |
Termin: | 13 czerwca 2018 roku o godz. 12:30 |
Miejsce: | pawilon B-1, sala 4 Al. Mickiewicza 30, 30-059 Kraków |
PROMOTOR: | dr hab. Zbisław Tabor, prof. PK – Politechnika Krakowska |
RECENZENCI: | prof. dr hab. inż. Andrzej Materka – Politechnika Łódzka |
prof. dr hab. inż. Ewa Piętka – Politechnika Śląska | |
Z rozprawą doktorską i opiniami recenzentów można się zapoznać w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30 |
Rozpoznawanie wzorców w grafach superpikselowych
mgr inż. Mateusz Baran
Promotor: dr hab. inż. Zbisław Tabor, prof. PK
Dyscyplina: Informatyka
Celem rozprawy jest opracowanie algorytmu pozwalającego na dokładne rozpoznawanie wzorca będącego obiektem na obrazie w oparciu o jego model statystyczny.
Typowym podejściem w tego rodzaju problemach jest zbudowanie modelu opartego o punkty charakterystyczne (Point Distribution Model, PDM), wstępne rozmieszczenie tych punktów na zadanym obrazie (ręcznie lub w oparciu o detektory cech) i iteracyjne optymalizowanie ich położeń minimalizując pewną funkcję celu wyważającą z jednej strony zgodność z modelem, a z drugiej dopasowanie do cech obrazu.
Do algorytmów tego typu można zaliczyć Active Shape Model, Pictorial Structures, Constrained Local Models i Regression-Voting.
Metody te w wielu zastosowaniach cechuje wysoka skuteczność, jednak jest ona zależna od właściwego doboru cech i detektorów cech, umieszczenia punktów charakterystycznych we właściwych, odpowiadających sobie miejscach obrazów oraz dostatecznie dobrej inicjalizacji rozmieszczenia tych punktów na analizowanym obrazie.
W niektórych zastosowaniach, na przykład w ilościowej analizie obrazów medycznych, wymagana jest dokładność większa niż oferowana przez istniejące algorytmy.
W odpowiedzi na to zapotrzebowanie w tej rozprawie są proponowane i analizowane dwie metody rozpoznawania obiektów w oparciu o ich model kształtu. Metody te opierają się o analizę obrazu po segmentacji superpikselowej, która ogranicza możliwe kształty do ścieżek w grafie określonym wspomnianą procedurą przetwarzania wstępnego. W ten sposób redukowana jest liczba możliwych przebiegów kształtu, znacząco zmniejszając przestrzeń rozwiązań którą trzeba przeszukać. Pozwala to na zastosowanie metod optymalizacji globalnej, rozwiązując problem inicjalizacji.
Rozprawa zajmuje się również kwestią reprezentacji kształtu w oparciu o funkcje ciągłe, inspirowaną Elastyczną Analizą Kształtu (Elastic Shape Analysis, ESA). Podejście to bardzo dobrze pasuje do rozpoznawania wzorców w grafach superpikselowych. Zamiast porównywać dwie krzywe, zaproponowany algorytm w sposób wydajny znajduje parę ścieżek w dwóch grafach skierowanych które są sobie najbliższe w metryce elastycznej rozważanej w ESA. Zadanie to było rozwiązywalne z użyciem istniejących metod tylko dla prostych klas grafów. Rozprawa zawiera analizę omawianego algorytmu.
Wymieniony nowy algorytm jest ponadto zintegrowany ze specjalnie zaprojektowaną metodą ekstrakcji cech kształtu opartą o uczenie maszynowe.
Uzyskana w ten sposób metoda dorównuje skuteczności najlepszych istniejących algorytmów segmentacji obrazu, działając stosunkowo szybko i posiadając niewielką liczbę wolnych parametrów.
Rozprawa podaje też dalsze możliwe kierunki rozwoju zaproponowanego algorytmu segmentacji.
Segmentacja jest bardzo ważnym zagadnieniem przetwarzania obrazów. Ma ona dwa zbliżone, choć odmienne znaczenia. Pierwsze z nich odnosi się do segmentacji jako grupowania pikseli obrazu w spójne grupy które są pod wybranym względem wewnętrznie jednorodne oraz różne między sobą. Drugie znaczenie jest zawężeniem tego pierwszego do podziału na dwa obszary, z których jeden reprezentuje określony obiekt naszego zainteresowania a drugi tło. Zagadnienie to bywa czasami nazywane binaryzacją. Segmentacja w tym drugim znaczeniu jest podstawowym przedmiotem rozprawy.
Ważnym czynnikiem decydującym o skuteczności przeprowadzanej segmentacji jest właściwe wykorzystanie posiadanej wiedzy o kształcie obiektu który ma być znaleziony na obrazie. Wiedza ta jest na ogół wyciągana z określonego zestawu obrazów podobnego typu co obrazy które mają być analizowane. Informacja ta często ma charakter modelu statystycznego, jak to ma miejsce na przykład w metodach opartych o punkty charakterystyczne takich jak Active Shape Model czy Active Appearance Model. Mimo licznych sukcesów tych podejść problem określania zbioru punktów charakterystycznych i ich lokalizacji w obrazie nie został satysfakcjonująco rozwiązany. Ponadto najpopularniejsze metody segmentacji wykorzystują przeszukiwanie lokalne do znalezienia najlepszego dopasowania. Jako punkt startowy przyjmowane jest pewne położenie początkowe określone ręcznie lub za pomocą detektorów cech, które jednak nie są niezawodne.
W niektórych zastosowaniach, na przykład w ilościowej analizie obrazów medycznych, wymagana jest dokładność większa niż oferowana przez istniejące algorytmy. W odpowiedzi na to zapotrzebowanie proponowane i analizowane są w tej rozprawie dwie metody rozpoznawania obiektów w oparciu o ich model kształtu. Metody te opierają się o analizę obrazu po segmentacji superpikselowej, która ogranicza możliwe kształty do ścieżek w grafie określonym wspomnianą procedurą przetwarzania wstępnego. W ten sposób redukowana jest liczba możliwych przebiegów kształtu, znacząco zmniejszając przestrzeń rozwiązań którą trzeba przeszukać. Pozwala to na zastosowanie metod optymalizacji globalnej, rozwiązując problem inicjalizacji.
Głównym celem rozprawy jest udowodnienie, że segmentacja superpikselowa jest skuteczną metodą przetwarzania wstępnego w rozpoznawaniu wzorców opartym o opartym o optymalizację globalną. Cel ten jest podzielony na trzy hipotezy badawcze:
Zaproponowany w rozprawie nowy algorytm integruje podejście oparte o funkcje ciągłe stosowane w Elastycznej Analizie Kształtu ze specjalnie zaprojektowaną metodą ekstrakcji cech kształtu opartą o uczenie maszynowe. Uzyskana w ten sposób metoda dorównuje skuteczności najlepszych istniejących algorytmów segmentacji obrazu, działając stosunkowo szybko i posiadając niewielką liczbę wolnych parametrów o istotnym wpływie na wynik.