Approximation d'un Réseau de Neurones ReLU interprétable par une Régression Logistique à Noyau
- Others:
- Laboratoire d'Informatique, Signaux, et Systèmes de Sophia-Antipolis (I3S) / Projet MEDIACODING ; Signal, Images et Systèmes (Laboratoire I3S - SIS) ; Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S) ; Université Nice Sophia Antipolis (1965 - 2019) (UNS)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S) ; Université Nice Sophia Antipolis (1965 - 2019) (UNS)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)
- Institut de pharmacologie moléculaire et cellulaire (IPMC) ; Université Nice Sophia Antipolis (1965 - 2019) (UNS)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)
Description
This paper proposes an understandable neural network whose score function is modeled as an additive sum of univariate spline functions. It extends usual understandable models like generative additive models, spline-based models, and neural additive models. An approximation of this neural network by a kernel logistic regression provides garantees on the convergence of the optimization problem. Thus, the proposed method is explainable since on the one hand, the resulted decision rule is interpretable and on the second hand, its resulted estimated parameters are unique for a given training dataset.
Abstract (French)
Cet article s'intéresse à un réseau de neurones interprétable dont la fonction de score se modélise comme une somme additive de fonctions splines univariées. Ce réseau est une extension des modèles interprétables usuels tels que les modèles additifs généralisés, les modèles à base de splines ainsi que les réseaux neuronaux additifs. Nous approchons le réseau de neurones par une régression logistique à noyau afin d'avoir des garanties quant à la convergence du processus d'entraînement. Ainsi, le modèle présenté est explicable puisque d'une part, la règle de décision estimée est interprétable et d'autre part, sa solution est unique conditionnellement à l'échantillon d'apprentissage.
Abstract
National audience
Additional details
- URL
- https://hal.science/hal-04195967
- URN
- urn:oai:HAL:hal-04195967v1
- Origin repository
- UNICA