Doctoraat Jan Ramon - Korte samenvatting

Clustering en instantiegebaseerd leren zijn twee belangrijke technieken in het domein van data mining. Er is veel onderzoek gebeurd gebruikmakend van een propositionele of attribuut-waarden voorstelling. Dit betekent dat de gegevens in een enkele tabel voorgesteld worden. In dit proefschrift worden clustering en instantiegebaseerd leren uitgebreid om data in een relationele voorstellingswijze te kunnen behandelen. Omdat de twee technieken gebruik maken van afstandsfunkties en prototypefunkties worden eerst deze twee componenten uitgebreid. Er wordt een efficient berekenbare metriek tussen verzamelingen voorgesteld, een metriek tussen logische termen die variabelen bevatten, en een metriek tussen logische interpretaties. Voor verzamelingen wordt een manier voorgesteld om prototypes te benaderen. Daarna worden een aantal algoritmes voor instantiegebaseerd leren en clustering uitgebreid. Instantiegebaseerd functieleren is een instantiegebaseerde leertechniek die logische termen als klasse toelaat in plaats van discrete waarden. Er worden meedere verbeteringen voorgesteld voor het top-down leren van logische beslissingsbomen met het clusteringssysteem Tic. De voorgestelde technieken worden geëvalueerd met experimenten op databanken uit chemie en biologie en met een toepassing in het bordspel go.