Cooccurrences spécifiques et représentations graphiques, le nouveau " Thème " d'Hyperbase
- Creators
- Vanni, Laurent
- Mittmann, Adiel
- Others:
- BCL, équipe Logométrie : corpus, traitements, modèles ; Bases, Corpus, Langage (UMR 7320 - UCA / CNRS) (BCL) ; Université Nice Sophia Antipolis (1965 - 2019) (UNS) ; COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS) ; COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)
- Universidade Federal de Santa Catarina = Federal University of Santa Catarina [Florianópolis] (UFSC)
- Damon Mayaffre
- Céline Poudat
- Laurent Vanni
- Véronique Magri
- Peter Follette
Description
Finding word cooccurrences and calculating the specificity scores is one of the most popular statistical methods in the analysis of textual data. Within Hyperbase, there is a " theme " feature for this purpose, which is capable of locating words that are used more commonly near a given word form, grammatical structure or lemma. The graphical representation of such an analysis is often challenging ; more than a list of the cooccurring words, it should be able to indicate the order, the score and the relations between pairs of words. Now that Hyperbase has a Web version, this article proposes a new approach for the " theme " feature : the calculation of cooccurrences has been extended to include the second level. The accompanying graphical representation is betting on new visual features in order to simplify reading the results and render the underlying calculation more explicit. Résumé Le calcul des cooccurrents spécifiques d'un mot est une des méthodes statistiques les plus populaires de l'ADT. Le logiciel Hyperbase a introduit cette notion avec la fonction " Th eme " qui rend compte du lexique surutilisé autour d'une forme, d'une structure grammaticale ou d'un lemme. La représentation graphique d'une telle analyse est souvent loin d'ˆ etré evidente. Plus que la simple liste des cooccurrents spécifiques , elle se doit de nous indiquer aussi l'ordre, l'´ ecart ainsi que les relations entre chaque paire de mots. Avec l' arrivée de la version Web d'Hyperbase, nous proposons aujourd'hui une nouvelle approche de cette fonction. Le calcul se voit pour l'occasion approfondi, lui permettant d'identifier la cooccurrence dedeuxì eme niveau. La représentation graphique, quant a elle, fait le pari de simplifier la lecture du résultat de cette analyse tout en explicitant plus précisément les calculs sous-jacents.
Abstract
International audience
Additional details
- URL
- https://hal.science/hal-01359413
- URN
- urn:oai:HAL:hal-01359413v1
- Origin repository
- UNICA