Profilage de textes : un cadre de travail et une expérience - HAL Accéder directement au contenu
Communication dans un congrès Année : 2000

Profilage de textes : un cadre de travail et une expérience

Résumé

Le recours croissant aux « très grands corpus » en Traitement Automatique des Langues (TAL) comme en analyse
textuelle suppose de maîtriser l'homogénéité lexicale, morpho-syntaxique et syntaxique des données utilisées.
Cela implique en amont le développement d'outils de calibrage de textes. Nous mettons en place de tels outils
et la méthodologie associée dans le cadre de l'appel d'offres ELRA Contribution à la réalisation de corpus du
français contemporain. Nous montrons sur les discours radio-télévisés de De Gaulle et de Mitterrand les premiers
résultats de cette approche. Nous tirons les conséquences de cette expérience pour les traits que nous employons
pour profiler les textes
Fichier principal
Vignette du fichier
jadt2000typtex.pdf ( 85.4 Ko ) Télécharger
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00151839, version 1 (27-06-2007)

Identifiants

  • HAL Id : halshs-00151839 , version 1

Citer

Serge Heiden, Sophie Prévost, Benoît Habert, Gabriel Illouz, Pierre Lafon, et al.. Profilage de textes : un cadre de travail et une expérience. JADT'2000, 2000, Lausanne, Suisse. Pagination non précisée. ⟨halshs-00151839⟩
163 Consultations
149 Téléchargements
Dernière date de mise à jour le 20/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus