Published February 29, 2012
| Version v1
Report
Localizing the Latent Structure Canonical Uncertainty: Entropy Profiles for Hidden Markov Models
Creators
Contributors
Others:
- Modelling and Inference of Complex and Structured Stochastic Systems (MISTIS) ; Centre Inria de l'Université Grenoble Alpes ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Jean Kuntzmann (LJK) ; Université Pierre Mendès France - Grenoble 2 (UPMF)-Université Joseph Fourier - Grenoble 1 (UJF)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP)-Centre National de la Recherche Scientifique (CNRS)-Université Pierre Mendès France - Grenoble 2 (UPMF)-Université Joseph Fourier - Grenoble 1 (UJF)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP)-Centre National de la Recherche Scientifique (CNRS)
- Modeling plant morphogenesis at different scales, from genes to phenotype (VIRTUAL PLANTS) ; Centre Inria d'Université Côte d'Azur (CRISAM) ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de la Recherche Agronomique (INRA)-Amélioration génétique et adaptation des plantes méditerranéennes et tropicales (UMR AGAP) ; Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut National de la Recherche Agronomique (INRA)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-Institut national d'études supérieures agronomiques de Montpellier (Montpellier SupAgro)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut National de la Recherche Agronomique (INRA)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-Institut national d'études supérieures agronomiques de Montpellier (Montpellier SupAgro)
- Amélioration génétique et adaptation des plantes méditerranéennes et tropicales (UMR AGAP) ; Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut National de la Recherche Agronomique (INRA)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-Institut national d'études supérieures agronomiques de Montpellier (Montpellier SupAgro)
- Inria
Description
This report addresses state inference for hidden Markov models. These models rely on unobserved states, which often have a meaningful interpretation. This makes it necessary to develop diagnostic tools for quantification of state uncertainty. The entropy of the state sequence that explains an observed sequence for a given hidden Markov chain model can be considered as the canonical measure of state sequence uncertainty. This canonical measure of state sequence uncertainty is not reflected by the classic multivariate state profiles computed by the smoothing algorithm, which summarizes the possible state sequences. Here, we introduce a new type of profiles which have the following properties: (i) these profiles of conditional entropies are a decomposition of the canonical measure of state sequence uncertainty along the sequence and makes it possible to localize this uncertainty, (ii) these profiles are univariate and thus remain easily interpretable on tree structures. We show how to extend the smoothing algorithms for hidden Markov chain and tree models to compute these entropy profiles efficiently.
Abstract (French)
Ce rapport concerne l'inférence sur les états de modèles de Markov cachés. Ces modèles se fondent sur des états non observés, qui ont en général une interprétation, dans le contexte d'une application donnée. Ceci rend nécessaire la conception d'outils de diagnostic pour quantifier l'incertitude sur ces états. L'entropie de la séquence d'états associée à une séquence observée, pour un modèle de chaîne de Markov cachée donné, peut être considérée comme la mesure canonique de l'incertitude sur les états. Cette mesure canonique d'incertitude sur la séquence d'états n'est pas reflétée par les profils d'états, multivariés, calculés par l'algorithme de lissage, qui résume les séquences d'états possibles. Nous introduisons ici de nouveaux profils dont les propriétés sont les suivantes : (i) ces profils d'entropie conditionnelle sont une décomposition, le long de cette séquence, de la mesure canonique d'incertitude sur la séquence d'états, ce qui offre la possibilité d'une localisation de cette incertitude, (ii) ces profils sont univariés; ils peuvent donc être facilement utilisés sur des structures arborescentes. Nous montrons comment étendre l'algorithme de lissage sur des chaînes et arbres de Markov cachés afin de calculer ces profils de manière efficace.Abstract
Accepted in Statistics & ComputingAdditional details
Identifiers
- URL
- https://inria.hal.science/hal-00675223
- URN
- urn:oai:HAL:hal-00675223v1
Origin repository
- Origin repository
- UNICA