Exploration informationnelle et construction des connaissances en génomique
Description
Fondé sur un exemple de réalisation de dispositif informationnel, nous présentons un mode de navigation qui, par l'exploration des données factuelles et textuelles, sert la construction de connaissances en génomique. L'impulsion du programme de séquençage complet du génome humain (le HGP), puis de celui d'autres génomes, et enfin la généralisation et l'évolution concomitante des séquenceurs, ont fait croître de manière exponentielle la production des séquences d'ADN. Cette recherche d'exhaustivité, liée au fait que toute l'information génétique nécessaire à un organisme est contenue dans son ADN , a propulsé la biologie moléculaire dans l'ère de la génomique. Pour faciliter l'accès et le traitement des séquences biologiques, il y a eu nécessité de les enregistrer dans les banques, désormais en ligne sur Internet. Ces banques de séquences sont filtrées par des équipes de bioinformaticiens pour réaliser des entrepôts de données dédiés à des recherches spécialisées sur un organisme, un type de molécule... Aussi, à travers des pages HTML ou des imagemaps générées par des scripts CGI à partir de bases de donnée, à travers une fédération de liens inter-banques rendue possible par des identifieurs uniques et à travers une fédération de bases de données devenue réalisable par des approches d'interopérabilité de composants logiciels, c'est tout un espace réticulaire qui offre aux génomistes de nouvelles explorations informationnelles . Nous montrons, à travers l'exemple de la détection de transfert de gènes, une possibilité de navigation dans un corpus de données textuelles et factuelles libre d'accès sur Internet et comment cette exploration informationnelle est source de créativité. Cet exemple de data mining s'appuie sur l'inspection de deux cartes superposées. La carte physique d'un chromosome et une carte d'états statistiques (homogénéité) de la séquence d'ADN. Ainsi la mise en évidence, par visualisation, de régions spécifiques, permet aux génomistes de créer de nouvelles connaissances.
Additional details
- URL
- https://hal.archives-ouvertes.fr/hal-00004844
- URN
- urn:oai:HAL:hal-00004844v1
- Origin repository
- UNICA