Contributions to geometric inference for manifolds and to the statistical study of persistence diagrams
- Creators
- Divol, Vincent
- Others:
- Laboratoire de Mathématiques d'Orsay (LMO) ; Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
- Understanding the Shape of Data (DATASHAPE) ; Inria Sophia Antipolis - Méditerranée (CRISAM) ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Inria Saclay - Ile de France ; Institut National de Recherche en Informatique et en Automatique (Inria)
- Université Paris-Saclay
- Pascal Massart
- Frédéric Chazal
Description
Topological data analysis (or TDA for short) consists in a set of methods aiming to extract topological and geometric information from complex nonlinear datasets. This field is here tackled from two different perspectives.First, we consider techniques from geometric inference, whose goal is to reconstruct geometric invariants of a manifold thanks to a random sample. We study from one hand the question of building an adaptive manifold estimator, and on the other hand the question of reconstructing the probability generating the observations.Second, we study persistent homology theory in TDA. A central tool in this theory, the persistence diagram, allows one to summarize in a multiscale fashion a dataset. We participate to the statistical study of persistence diagrams in several ways: first, by studying the metric structure of the space of persistence diagrams, and second, by defining a notion of linear expectation in this space. Diverse properties of this average object are then exhibited (asymptotic behavior, regularity, etc.)
Abstract (French)
L'analyse topologique des données consiste en un ensemble de méthodes permettant d'extraire des informations topologiques et géométriques de jeux de données. Nous abordons ici ce domaine sous deux angles différents.Dans un premier temps, nous considérons des techniques d'inférence géométrique, qui visent à reconstruire des invariants géométriques d'une variété à partir d'un nuage de points proche de celle-ci. Nous étudions d'une part le problème de construire des estimateurs adaptatifs de cette variété, et d'autre part la question de la reconstruction de la probabilité générant les données.Dans un second temps, nous nous intéressons à la théorie de l'homologie persistante pour l'analyse de données. Un objet central dans cette théorie, le diagramme de persistance, permet de résumer de manière multi-échelle un jeu de données. Nous participons à l'étude statistique des diagrammes de persistance de plusieurs façons: tout d'abord en étudiant la structure métrique de l'espace des diagrammes de persistance, ensuite en définissant une notion de moyenne linéaire dans cet espace. Diverses propriétés de cet objet moyen sont alors exhibées (comportement asymptotique, régularité, etc.).
Additional details
- URL
- https://theses.hal.science/tel-03526626
- URN
- urn:oai:HAL:tel-03526626v2
- Origin repository
- UNICA