Skip to Main content Skip to Navigation
Journal articles

Normalisation et lemmatisation d'une question ouverte : Les femmes face au changement familial

Résumé : La normalisation consiste à réduire les majuscules des noms communs, à uniformiser les orthographes multiples des noms propres, des dates et des chiffres ou de certains mots communs, à déployer les abréviations, etc. La lemmatisation associe à ces graphies normalisées un lemme correspondant à l'entrée du dictionnaire et une catégorie grammaticale. Ces tâches sont confiées à un automate dont l'efficacité est testée sur les réponses à une question ouverte dans une enquête sur les causes de divorce. Par rapport aux formes graphiques brutes, les données lemmatisées réduisent le nombre de mots différents et permettent de retrouver les principaux thèmes. Elles mettent également à jour certaines déformations produites par la manière dont les enquêteurs retranscrivent les réponses.
Complete list of metadatas

Cited literature [17 references]  Display  Hide  Download

https://halshs.archives-ouvertes.fr/halshs-00799938
Contributor : Dominique Labbé <>
Submitted on : Tuesday, March 12, 2013 - 9:15:44 PM
Last modification on : Friday, July 17, 2020 - 9:28:29 AM
Document(s) archivé(s) le : Monday, June 17, 2013 - 12:33:47 PM

File

LabbeGrenobleMSH2001.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : halshs-00799938, version 1

Collections

CNRS | PACTE | UGA

Citation

Dominique Labbé. Normalisation et lemmatisation d'une question ouverte : Les femmes face au changement familial. Journal de la Société Française de Statistique, Société Française de Statistique et Société Mathématique de France, 2001, 4 (142), pp.37-57. ⟨halshs-00799938⟩

Share

Metrics

Record views

376

Files downloads

716