Fouille de motifs et CRF pour la reconnaissance de symptômes dans les textes biomédicaux

Résumé : Dans cet article, nous nous intéressons à l'extraction d'entités médicales de type symptôme dans les textes biomédicaux. Cette tâche est peu explorée dans la littérature et il n'existe pas à notre connaissance de corpus annoté pour entraîner un modèle d'apprentissage. Nous proposons deux approches faiblement supervisées pour extraire ces entités. Une première est fondée sur la fouille de motifs et introduit une nouvelle contrainte de similarité sémantique. La seconde formule la tache comme une tache d'étiquetage de séquences en utilisant les CRF (champs conditionnels aléatoires). Nous décrivons les expérimentations menées qui montrent que les deux approches sont complémentaires en termes d'évaluation quantitative (rappel et précision). Nous montrons en outre que leur combinaison améliore sensiblement les résultats.
Type de document :
Communication dans un congrès
23e conférence sur le Traitement Automatique des Langues Naturelles (TALN’16), Jul 2016, Paris, France. pp.194-206, Actes de la 23e conférence sur le Traitement Automatique des Langues Naturelles (TALN’16)
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://halshs.archives-ouvertes.fr/halshs-01727081
Contributeur : Laboratoire Modyco <>
Soumis le : lundi 12 mars 2018 - 14:11:15
Dernière modification le : mercredi 4 juillet 2018 - 23:14:10
Document(s) archivé(s) le : mercredi 13 juin 2018 - 12:13:01

Fichier

taln-2016-paper-actes.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : halshs-01727081, version 1

Citation

Pierre Holat, Nadi Tomeh, Thierry Charnois, Delphine Battistelli, Marie-Christine Jaulent, et al.. Fouille de motifs et CRF pour la reconnaissance de symptômes dans les textes biomédicaux. 23e conférence sur le Traitement Automatique des Langues Naturelles (TALN’16), Jul 2016, Paris, France. pp.194-206, Actes de la 23e conférence sur le Traitement Automatique des Langues Naturelles (TALN’16). 〈halshs-01727081〉

Partager

Métriques

Consultations de la notice

86

Téléchargements de fichiers

41