Zaproszenie na obronę pracy doktorskiej

DZIEKAN i RADA WYDZIAŁU ELEKTROTECHNIKI, AUTOMATYKI, INFORMATYKI i INŻYNIERII BIOMEDYCZNEJ AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE
zapraszają na publiczną dyskusję nad rozprawą doktorską mgra inż. Mateusza Barana
ROZPOZNAWANIE WZORCÓW W GRAFACH SUPERPIKSELOWYCH
Termin:	13 czerwca 2018 roku o godz. 12:30
Miejsce:	pawilon B-1, sala 4 Al. Mickiewicza 30, 30-059 Kraków
PROMOTOR:	dr hab. Zbisław Tabor, prof. PK – Politechnika Krakowska
RECENZENCI:	prof. dr hab. inż. Andrzej Materka – Politechnika Łódzka
RECENZENCI:	prof. dr hab. inż. Ewa Piętka – Politechnika Śląska
Z rozprawą doktorską i opiniami recenzentów można się zapoznać w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30

Streszczenie

Rozpoznawanie wzorców w grafach superpikselowych

mgr inż. Mateusz Baran

Promotor: dr hab. inż. Zbisław Tabor, prof. PK
Dyscyplina: Informatyka

Celem rozprawy jest opracowanie algorytmu pozwalającego na dokładne rozpoznawanie wzorca będącego obiektem na obrazie w oparciu o jego model statystyczny. Typowym podejściem w tego rodzaju problemach jest zbudowanie modelu opartego o punkty charakterystyczne (Point Distribution Model, PDM), wstępne rozmieszczenie tych punktów na zadanym obrazie (ręcznie lub w oparciu o detektory cech) i iteracyjne optymalizowanie ich położeń minimalizując pewną funkcję celu wyważającą z jednej strony zgodność z modelem, a z drugiej dopasowanie do cech obrazu. Do algorytmów tego typu można zaliczyć Active Shape Model, Pictorial Structures, Constrained Local Models i Regression-Voting. Metody te w wielu zastosowaniach cechuje wysoka skuteczność, jednak jest ona zależna od właściwego doboru cech i detektorów cech, umieszczenia punktów charakterystycznych we właściwych, odpowiadających sobie miejscach obrazów oraz dostatecznie dobrej inicjalizacji rozmieszczenia tych punktów na analizowanym obrazie. W niektórych zastosowaniach, na przykład w ilościowej analizie obrazów medycznych, wymagana jest dokładność większa niż oferowana przez istniejące algorytmy.

W odpowiedzi na to zapotrzebowanie w tej rozprawie są proponowane i analizowane dwie metody rozpoznawania obiektów w oparciu o ich model kształtu. Metody te opierają się o analizę obrazu po segmentacji superpikselowej, która ogranicza możliwe kształty do ścieżek w grafie określonym wspomnianą procedurą przetwarzania wstępnego. W ten sposób redukowana jest liczba możliwych przebiegów kształtu, znacząco zmniejszając przestrzeń rozwiązań którą trzeba przeszukać. Pozwala to na zastosowanie metod optymalizacji globalnej, rozwiązując problem inicjalizacji.

Rozprawa zajmuje się również kwestią reprezentacji kształtu w oparciu o funkcje ciągłe, inspirowaną Elastyczną Analizą Kształtu (Elastic Shape Analysis, ESA). Podejście to bardzo dobrze pasuje do rozpoznawania wzorców w grafach superpikselowych. Zamiast porównywać dwie krzywe, zaproponowany algorytm w sposób wydajny znajduje parę ścieżek w dwóch grafach skierowanych które są sobie najbliższe w metryce elastycznej rozważanej w ESA. Zadanie to było rozwiązywalne z użyciem istniejących metod tylko dla prostych klas grafów. Rozprawa zawiera analizę omawianego algorytmu.

Wymieniony nowy algorytm jest ponadto zintegrowany ze specjalnie zaprojektowaną metodą ekstrakcji cech kształtu opartą o uczenie maszynowe. Uzyskana w ten sposób metoda dorównuje skuteczności najlepszych istniejących algorytmów segmentacji obrazu, działając stosunkowo szybko i posiadając niewielką liczbę wolnych parametrów. Rozprawa podaje też dalsze możliwe kierunki rozwoju zaproponowanego algorytmu segmentacji.

Autoreferat

Segmentacja jest bardzo ważnym zagadnieniem przetwarzania obrazów. Ma ona dwa zbliżone, choć odmienne znaczenia. Pierwsze z nich odnosi się do segmentacji jako grupowania pikseli obrazu w spójne grupy które są pod wybranym względem wewnętrznie jednorodne oraz różne między sobą. Drugie znaczenie jest zawężeniem tego pierwszego do podziału na dwa obszary, z których jeden reprezentuje określony obiekt naszego zainteresowania a drugi tło. Zagadnienie to bywa czasami nazywane binaryzacją. Segmentacja w tym drugim znaczeniu jest podstawowym przedmiotem rozprawy.

Ważnym czynnikiem decydującym o skuteczności przeprowadzanej segmentacji jest właściwe wykorzystanie posiadanej wiedzy o kształcie obiektu który ma być znaleziony na obrazie. Wiedza ta jest na ogół wyciągana z określonego zestawu obrazów podobnego typu co obrazy które mają być analizowane. Informacja ta często ma charakter modelu statystycznego, jak to ma miejsce na przykład w metodach opartych o punkty charakterystyczne takich jak Active Shape Model czy Active Appearance Model. Mimo licznych sukcesów tych podejść problem określania zbioru punktów charakterystycznych i ich lokalizacji w obrazie nie został satysfakcjonująco rozwiązany. Ponadto najpopularniejsze metody segmentacji wykorzystują przeszukiwanie lokalne do znalezienia najlepszego dopasowania. Jako punkt startowy przyjmowane jest pewne położenie początkowe określone ręcznie lub za pomocą detektorów cech, które jednak nie są niezawodne.

W niektórych zastosowaniach, na przykład w ilościowej analizie obrazów medycznych, wymagana jest dokładność większa niż oferowana przez istniejące algorytmy. W odpowiedzi na to zapotrzebowanie proponowane i analizowane są w tej rozprawie dwie metody rozpoznawania obiektów w oparciu o ich model kształtu. Metody te opierają się o analizę obrazu po segmentacji superpikselowej, która ogranicza możliwe kształty do ścieżek w grafie określonym wspomnianą procedurą przetwarzania wstępnego. W ten sposób redukowana jest liczba możliwych przebiegów kształtu, znacząco zmniejszając przestrzeń rozwiązań którą trzeba przeszukać. Pozwala to na zastosowanie metod optymalizacji globalnej, rozwiązując problem inicjalizacji.

Głównym celem rozprawy jest udowodnienie, że segmentacja superpikselowa jest skuteczną metodą przetwarzania wstępnego w rozpoznawaniu wzorców opartym o opartym o optymalizację globalną. Cel ten jest podzielony na trzy hipotezy badawcze:

Możliwe jest uzyskanie wysokiej dokładności segmentacji przy ograniczeniu przeszukiwanej przestrzeni do segmentacji superpikselowej analizowanego obrazu.
Istnieje wydajna, globalna metoda o małej liczbie parametrów która segmentuje obraz ograniczając się do brzegów superpikseli.
Metody uczenia maszynowego pozwalają efektywnie poprawić skuteczność wymienionego algorytmu tak aby dorównywał wiodącym algorytmom przy niewielkim manipulowaniu parametrami.

Zaproponowany w rozprawie nowy algorytm integruje podejście oparte o funkcje ciągłe stosowane w Elastycznej Analizie Kształtu ze specjalnie zaprojektowaną metodą ekstrakcji cech kształtu opartą o uczenie maszynowe. Uzyskana w ten sposób metoda dorównuje skuteczności najlepszych istniejących algorytmów segmentacji obrazu, działając stosunkowo szybko i posiadając niewielką liczbę wolnych parametrów o istotnym wpływie na wynik.

Praca Doktorska

Praca doktorska

Ważniejsze publikacje autora rozprawy

M. Baran, Z. Tabor. Principal Geodesic Analysis Boundary Delineation with Superpixelbased Constraints, Image Analysis & Stereology, vol. 36, pp. 223–232, 2017
M. Baran. Closest Paths in Graph Drawings under an Elastic Metric. International Journal of Applied Mathematics and Computer Science, vol. 28(2), 2018
T. Pięciak, M. Baran, M. Ubrańczyk. Level-set based segmentation of carotid arteries in computer tomography angiography images, Journal of Medical Informatics & Technologies, vol. 17, pp. 281–286, 2011
M. Baran, L. K. Bieniasz. Experiments with an adaptive multicut-HDMR map generation for slowly varying continuous multivariate functions, Applied Mathematics and Computation, vol. 258, pp. 206–219, May 2015.
M. Baran, L. K. Bieniasz. An adaptive multicut-HDMR map generation, in AIP Conference Proceedings, 2016, vol. 1738, p. 480055
M. Baran, K. Kluza, G. J. Nalepa, A. Ligęza. A hierarchical approach for configuring business processes, in 2013 Federated Conference on Computer Science and Information Systems (FedCSIS), Krakow, 2013, pp. 915–921.
M. Baran, A. Ligęza. Rule-Based Knowledge Management in Social Threat Monitor, in Multimedia Communications, Services and Security, A. Dziech, A. Czyzewski, Eds. Springer Berlin Heidelberg, 2013, pp. 1–12.
S. Bobek, M. Baran, K. Kluza, G. J. Nalepa. Application of Bayesian Networks to Recommendations in Business Process Modeling, presented at the AIBP@AI*IA, 2013, pp. 41–50.
K. Kluza, M. Baran, S. Bobek. Overview of Recommendation Techniques in Business Process Modeling, presented at the KESE 2013.
M. Baran, K. Kułakowski, A. Ligęza. A Note on Machine Learning Approach to Analyze the Results of Pairwise Comparison Based Parametric Evaluation of Research Units, in Artificial Intelligence and Soft Computing, L. Rutkowski, M. Korytkowski, R. Scherer, R. Tadeusiewicz, L. A. Zadeh, J. M. Zurada, Eds. Springer International Publishing, 2014, pp. 27–39.
M. Baran, K. Kluza, G. J. Nalepa, A. Ligęza. A Multi-level Hierarchical Approach for Configuring Business Processes, in Advances in ICT for Business, Industry and Public Sector, M. Mach-Król, C. M. Olszak, T. Pełech-Pilichowski, Eds. Springer International Publishing, 2015, pp. 1–18.
M. Baran. Multivariate function approximation using sparse grids and high Dimensional Model Representation – a comparison, Czasopismo Techniczne, Nauki Podstawowe Zeszyt 3 NP (17) 2014, pp. 97–107, Feb. 2015.

Recenzje

prof. dr hab. inż. Andrzej Materka, PŁ Recenzja nr 1
prof. dr hab. inż. Ewa Piętka, PŚ Recenzja nr 2