Published December 13, 2006 | Version v1
Publication

Expert knowledge integration into data mining process in order to extract intersting and relevant informations

Description

Knowledge discovery from data is a process that aims to extract potentially useful knowledge hidden in large databases. Current works, in order to evaluate extracted patterns use interestingness measures. Such measures of interestingness are divided into objective measures that depend only on the structure of a pattern and the underlying data used in the discovery process, and the
subjective measures that also depend on the class of users who examine the pattern. However, it remains difficult to select relevant models according domain expert knowledge and the lack of formalism in knowledge expression prevents to compare expert knowledge to extracted patterns. We present KEOPS approach based on a method which use expert knowledge during a data mining process. An ontology driven information system (ODIS) plays a central role in KEOPS, allowing efficient data selection, data preparation and models interpretation. Furthermore, KEOPS uses a part-way interestingness
measure between objective and subjective measure in order to evaluate models relevance according to expert knowledge. Finally, KEOPS helps to create and maintain strategies in order to improve data mining processes and to monitor models usage in day-to-day business. KEOPS was deployed in order to study relationships with
beneficiaries of allowances from the `family' branch of the French national health care system (CAF: Caisse Nationale d'Allocations Familiales). The objective of this study was to help executives with relevant and useful information.

Abstract (French)

L'extraction automatique de connaissances à partir des données peut être considérée comme la découverte d'informations enfouies dans de très grands volumes de données. Les approches Actuelles, pour évaluer la pertinence des informations extraites, se distinguent en deux catégories : les approches objectives qui mettent en oeuvre des mesures d'intérêt afin d'évaluer les propriétés statistiques des modèles extraits et les approches subjectives qui confrontent les modèles extraits à des connaissances exprimées sur le domaine et nécessitent généralement l'interrogation d'experts. Toutefois, le choix de modèles pertinents en regard de la connaissance métier d'un expert reste un problème ouvert et l'absence de formalisme dans l'expression des connaissances nuit à la mise au point de techniques automatiques de confrontation des modèles permettant d'exploiter toute la richesse sémantique des connaissances expertes. L'approche KEOPS que nous proposons dans ce mémoire, répond à cette problématique en proposant une méthodologie qui intègre les connaissances des experts d'un domaine tout au long du processus de fouille. Un système d'information dirigé par une ontologie (ODIS) joue un rôle central dans le système KEOPS en permettant d'organiser rationnellement non seulement la préparation des données mais aussi la sélection et l'interprétation des modèles générés. Une mesure d'intérêt est proposée afin de prendre en compte les centres d'intérêt et le niveau de connaissance des experts. Le choix des modèles les plus pertinents se base sur une évaluation à la fois objective pour évaluer la précision des motifs et subjective pour évaluer l'intérêt des modèles pour les experts du domaine. Enfin l'approche KEOPS facilite la définition de stratégies pour améliorer le processus de fouille de données dans le temps en fonction des résultats observés. Les différents apports de l'approche KEOPS favorisent l'automatisation du processus de fouille de données, et ainsi, une dynamique d'apprentissage peut être initiée pour obtenir un processus de fouille particulièrement bien adapté au domaine étudié. KEOPS a été mise en oeuvre dans le cadre de l'étude de la gestion des relations avec les allocataires au sein des Caisses d'Allocations Familiales. L'objectif de cette étude a été d'analyser la relation de service rendu aux allocataires afin de fournir aux décideurs des connaissances précises, pertinentes et utiles pour l'amélioration de ce service.

Additional details

Created:
December 4, 2022
Modified:
November 27, 2023