Profilage de textes : un cadre de travail et une expérience

Résumé : Le recours croissant aux « très grands corpus » en Traitement Automatique des Langues (TAL) comme en analyse
textuelle suppose de maîtriser l'homogénéité lexicale, morpho-syntaxique et syntaxique des données utilisées.
Cela implique en amont le développement d'outils de calibrage de textes. Nous mettons en place de tels outils
et la méthodologie associée dans le cadre de l'appel d'offres ELRA Contribution à la réalisation de corpus du
français contemporain. Nous montrons sur les discours radio-télévisés de De Gaulle et de Mitterrand les premiers
résultats de cette approche. Nous tirons les conséquences de cette expérience pour les traits que nous employons
pour profiler les textes
Document type :
Conference papers
Complete list of metadatas

https://halshs.archives-ouvertes.fr/halshs-00151839
Contributor : Serge Heiden <>
Submitted on : Wednesday, June 27, 2007 - 10:12:34 AM
Last modification on : Saturday, May 4, 2019 - 1:21:19 AM
Long-term archiving on : Thursday, April 8, 2010 - 5:15:24 PM

File

jadt2000typtex.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : halshs-00151839, version 1

Citation

Serge Heiden, Sophie Prévost, Benoît Habert, Gabriel Illouz, Pierre Lafon, et al.. Profilage de textes : un cadre de travail et une expérience. JADT'2000, 2000, Lausanne, Suisse. Pagination non précisée. ⟨halshs-00151839⟩

Share

Metrics

Record views

283

Files downloads

210