DZIEKAN i RADA WYDZIAŁU ELEKTROTECHNIKI, AUTOMATYKI, INFORMATYKI i INŻYNIERII BIOMEDYCZNEJ AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE |
|
---|---|
zapraszają na publiczną dyskusję nad rozprawą doktorską mgr inż. Patryka Orzechowskiego |
|
Aggregated biclustering algorithms and their efficient implementation | |
Termin: | 26 lutego 2015 roku o godz. 13:30 |
Miejsce: | pawilon B-1, sala 4 Al. Mickiewicza 30, 30-059 Kraków |
PROMOTOR: | Dr hab. inż. Krzysztof Boryczko, prof. AGH - Akademia Górniczo-Hutnicza |
RECENZENCI: | Prof. dr hab. inż. Ryszard Tadeusiewicz - Akademia Górniczo-Hutnicza |
Prof. dr hab. inż. Marek Kurzyński - Politechnika Wrocławska | |
Z rozprawą doktorską i opiniami recenzentów można się zapoznać w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30 |
Aggregated biclystering algorithms and their efficient implementation
mgr inż. Patryk Orzechowski
Promotor: dr hab. inż. Krzysztof Boryczko, prof. AGH
Dyscyplina: Informatyka
Biklasteryzacja to jedna z technik eksploracji danych (ang. data mining), która pozwala równocześnie uwzględniać zarówno wzorce, jak i ich atrybuty (stąd przedrostek „bi”). Umożliwia to identyfikację podobieństw w skali lokalnej (tj. podzbiorów podobnych do siebie wzorców dla wybranych atrybutów), a nie tylko globalnej (klasyfikację wzorców na podstawie wszystkich ich atrybutów).
W pracy zaproponowano grupę zagregowanych algorytmów biklasteryzacji, których istota polega na łączeniu wybranych aspektów (np. koncepcji, metryki podobieństwa, sposobu przetwarzania danych czy też reprezentacji danych) istniejących metod. Zaprezentowano kilka wybranych algorytmów zagregowanych oraz przedstawiono ich implementację: sekwencyjną i dostosowaną do architektur masywnie równoległych. Dokonano również przeglądu najpopularniejszych algorytmów biklasteryzacji.
Efektem pracy jest m.in. przedstawienie zunifikowanej hierarchii algorytmów biklasteryzacji, uporządkowanej relacją generalizacji. W celu oceny jakości algorytmów biklasteryzacji, rozwinięto metodologię analizy zbiorów danych pochodzących z serii eksperymentów mikromacierzowych (GSE). Zaproponowano nowy klasyfikator, pozwalający na porównanie różnych algorytmów biklasteryzacji. Przeprowadzono eksperyment mający na celu wskazanie optymalnej metody przetwarzania wstępnego dla poszczególnych algorytmów biklasteryzacji. Wskazano sens zastosowania algorytmów zagregowanych w celu poprawy różnorodności wyników. Przedstawiono również nowe zastosowania biklasteryzacji, w takich obszarach jak analiza danych produkcyjnych, przetwarzanie tekstu oraz sieci społecznościowe.
Pełna wersja autoreferatu autoreferat.pdf