Author : Wiem Chebil
Publisher :
ISBN 13 :
Total Pages : 175 pages
Book Rating : 4.:/5 (971 download)
Book Synopsis Méthodes d'indexation multi-terminologique à base de connaissances : application aux documents en santé by : Wiem Chebil
Download or read book Méthodes d'indexation multi-terminologique à base de connaissances : application aux documents en santé written by Wiem Chebil and published by . This book was released on 2016 with total page 175 pages. Available in PDF, EPUB and Kindle. Book excerpt: La grande quantité de données gérée par les systèmes de recherche d'information constituent un véritable enjeu surtout lorsqu'il s'agit de données biomédicales. En effet, la tâche d'indexation des documents ou des requêtes est pénible pour les experts et le remplacement de ces derniers par des approches automatiques est indispensable. Dans le but d'améliorer la performance de la gestion automatique des SRI (Systèmes de recherche d'information) pour qu'elle puisse s'approcher le plus de celle manuelle, nous proposons dans cette thèse des approches d'indexation. Ces derniers visent à minimiser les erreurs d'indexation des documents et des requêtes. En effet, nous avons réalisé d'abord une étude empirique qui vise à évaluer la fonction d'indexation de CISMeF (Catalogue et index des Sites Médicaux de langue Française). Nous nous sommes basés ensuite sur les catégories d'erreurs d'indexation identifiées pour proposer une approche à base de Modèle Vectoriel (MV), qui vise à minimiser les erreurs de désuffixation et à réduire l'information inutile générée par l'appariement partiel (ou approximatif). Ceci en exploitant l'information sémantique et statistique fournie par l'UMLS (Unified Medical Language System). L'approche d'indexation à base de MV propose aussi un nouveau poids des termes d'indexation. Ce poids est à la fois sémantique, statistique et prend en considération la structure du document. Nous avons aussi exploité un réseau bayésien (RB) qui contribue, à travers sa capacité à résoudre l'incertitude et sa capacité à exploiter l'architecture des terminologies, à mieux classer les concepts. De plus, nous avons proposé une approche d'indexation à base d'un réseau possibiliste (RP). Notre contributin principale à travers cette approche est d'améliorer l'estimation de la pertinence des concepts d'indexation en les classant à travers une évaluation double. Cette dernière consiste en deux mesures de possibilité et de nécessité. Nous avons ensuite combiné le RP et le VSM en se basant sur le fait que les avantages de l'un sont différents de ceux des avantages de l'autre et les deux modèles sont complémentaires. De plus, nous avons exploité ke RP pour la première fois pour l'enrichissement des requêtes par de nouveaux concepts qui sont sémantiquement proches de ceux de l'index initial. Cette approche contribue à améliorer le classement des concepts candidats pour l'enrichissement. L'intégration de ces contributions dans un SRI et son évaluation par rapport à ceux existants a mis en évidence l'intérêt des solutions que nous avons proposées dans le but de minimiser les erreurs d'indexation.