Analyse des données textuelles
- Others:
- Département Sciences Economiques et Sociales (SES) ; Télécom ParisTech
- Télécom ParisTech
- Institut d'Histoire des Représentations et des Idées dans les Modernités (IHRIM) ; École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML) ; Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet [Saint-Étienne] (UJM)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS)
- BCL, équipe Logométrie : corpus, traitements, modèles ; Bases, Corpus, Langage (UMR 7320 - UCA / CNRS) (BCL) ; Université Nice Sophia Antipolis (1965 - 2019) (UNS) ; COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS) ; COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)
- Gilles Raîche
Description
L'analyse des données textuelles (ADT) permet d'explorer et de visualiser les recueils de textes les plus divers: œuvres littéraires, transcriptions d'entretien, discours politiques, dossiers de presse, documents d'archives, enquêtes en ligne avec questions ouvertes, fichiers de réclamations, sondages de satisfaction. Le présent ouvrage procède à une présentation rigoureuse des méthodes de l'ADT, qui combinent statistique exploratoire, visualisations, procédures de validation quantitative et approche qualitative (retour au texte). Plaçant le texte au centre de l'analyse, l'ADT répond pleinement aux attentes des humanités numériques. Plusieurs niveaux de lecture sont possibles: les développements plus techniques paraissent dans des encadrés, tandis que des programmes illustratifs simples (en Python et R) sont donnés en annexe. Le propos est systématiquement illustré par des applications concrètes, issues de corpus variés (données d'enquête, romans, discours politiques) et réalisées avec des logiciels en libre accès.
Abstract
International audience
Additional details
- URL
- https://hal.archives-ouvertes.fr/hal-02416659
- URN
- urn:oai:HAL:hal-02416659v1
- Origin repository
- UNICA