DZIEKAN i RADA WYDZIAŁU ELEKTROTECHNIKI, AUTOMATYKI, INFORMATYKI i ELEKTRONIKI AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE |
---|
zapraszają na publiczą dyskusję nad rozprawą doktorską mgra inż. Maksymiliana Knapa |
Badania nad nowymi algorytmami generowania drzew decyzji |
Dyskusja odbędzie się 15 czerwca 2009 roku o godz. 11:00 w bud. B-1, sala 102 al. Mickiewicza 30, 30-059 Kraków |
PROMOTOR: Prof. dr hab. inż. Zdzisław S. Hippe – Wyższa Szkoła Informatyki i Zarządzania w Rzeszowie |
RECENZENCI: Dr hab. inż. Marian Wysocki – Politechnika Rzeszowska |
Prof. dr hab. inż. Edward Nawarecki– Akademia Górniczo-Hutnicza |
Z rozprawą doktorską i opiniami recenzentów można się zapoznać w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30 |
Badania nad nowymi algorytmami generowania drzew decyzji
Mgr inż. Maksymilian Knap
Promotor: Prof. dr hab. inż. Zdzisław S. Hippe – Wyższa Szkoła Informatyki i Zarządzania w Rzeszowie
Dyscyplina: Informatyka
W ramach rozprawy opracowane zostały dwa nowe algorytmy generowania drzew decyzji: TVR (Tree-Via-Rule) oraz VCF (Varied-Confidence-Factor). Pierwszy z nich, tworzy drzewo decyzji z uprzednio wygenerowanych quasi-optymalnych reguł składniowych. Natomiast drugi algorytm, wykorzystuje podczas generowania drzewa informację o istotności w procesie klasyfikacji poszczególnych atrybutów opisujących, pobraną z generowanej w tle – dla analizowanych danych – sieci przekonań Bayesa. W korzeniu tak generowanego drzewa, umieszczony zostaje atrybut opisujący, ujawniający największy wpływ marginalnego prawdopodobieństwa na atrybut decyzyjny. Dodatkowo, algorytm TVR został zaprojektowany z uwzględnieniem elementów teorii zbiorów przybliżonych Pawlaka, co pozwoliło na przetwarzanie zbiorów uczących zawierających przypadki sprzeczne.
Wspomniane algorytmy zostały zaimplementowane w specjalnie opracowanym systemie analizy danych TreeSEEKER, umożliwiającym m. inn. generowanie drzew decyzji przy pomocy różnych algorytmów (poza wspomnianymi nowo-opracowanymi algorytmami TVR i VCF system pozwala generować drzewa algorytmami ID3/C4.5 oraz algorytmem opartym o współczynniki Czerwińskiego), graficzną ich reprezentację oraz testowanie ich skuteczności klasyfikacyjnej.
Opracowany system informacyjny poddano szczegółowym badaniom, wykorzystując bazy informacyjne, zaczerpnięte z repozytorium Uniwersytetu Kalifornijskiego w Irvinie, powszechnie używane w badaniach z dziedziny uczenia maszynowego, a także własne dane o znamionach melanocytowych skóry.
Pełna wersja autoreferatu autoreferat-mknap.pdf.