Date de l'évènement :
Lieu de l'évènement :
Webinar organisé conjointement par le SESSTIM et l'Open Health INSTITUTE.
Ce webinar participe au GIFT Big data(Groupement Interdisciplinaire de Formations Thématiques) d'AMU.
Des dossiers de patients aux publications scientifiques, la langue naturelle est porteuse d'informations et de connaissances importantes pour la e-Santé. Cela crée un besoin d'algorithmes d'analyse automatique de ces textes libres : leur objectif est d'extraire ces informations et connaissances et de les convertir dans un format normalisé avant leur enregistrement à des fins d'exploitation médicale, de recherche ou de gestion. Dans ce contexte, je présenterai les méthodes qui visent à déterminer quel concept d'un référentiel donné correspond le mieux à une expression en texte libre : c'est la problématique du codage. Je l'illustrerai sur le cas du codage des causes de décès dans la Classification internationale des maladies. Je présenterai les deux familles de méthodes couramment employées pour réaliser cette tâche. La première famille effectue une recherche plus ou moins souple dans un dictionnaire. La seconde apprend à déterminer les codes à assigner à partir d'exemples de codages antérieurs. Les deux tâches peuvent bénéficier de l'apport de masses de données directement liées à la tâche ou pas.