Doctoraat Jan Ramon - Korte samenvatting
Clustering en instantiegebaseerd leren zijn twee belangrijke technieken in
het domein van data mining. Er is veel onderzoek gebeurd gebruikmakend
van een propositionele of attribuut-waarden voorstelling. Dit betekent
dat de gegevens in een enkele tabel voorgesteld worden. In dit
proefschrift worden clustering en instantiegebaseerd leren uitgebreid om
data in een relationele voorstellingswijze te kunnen behandelen. Omdat de
twee technieken gebruik maken van afstandsfunkties en prototypefunkties
worden eerst deze twee componenten uitgebreid. Er wordt een efficient
berekenbare metriek tussen verzamelingen voorgesteld, een metriek tussen
logische termen die variabelen bevatten, en een metriek tussen logische
interpretaties. Voor verzamelingen wordt een manier voorgesteld om
prototypes te benaderen. Daarna worden een aantal algoritmes voor
instantiegebaseerd leren en clustering uitgebreid. Instantiegebaseerd
functieleren is een instantiegebaseerde leertechniek die logische termen
als klasse toelaat in plaats van discrete waarden. Er worden meedere
verbeteringen voorgesteld voor het top-down leren van logische
beslissingsbomen met het clusteringssysteem Tic. De voorgestelde
technieken worden geëvalueerd met experimenten op databanken uit chemie
en biologie en met een toepassing in het bordspel go.