Prendre Le Monde en main : choix d'architecture
Résumé
Le recours croissant aux très grands corpus pour améliorer les systèmes
de Traitement Automatique des Langues TAL suppose de maîriser l'homogénéité lexicale morphosyntaxique et syntaxique des données utilisées.
Cela implique en amont le développement d'outils de calibrage de textes.
Nous mettons en place de tels outils et la méthodologie associée dans le cadre de l'appel d'offres ELRA "Contribution à la réalisation
de corpus du français contemporain"
Nous montrons sur les rubriques principales du journal Le Monde les premiers réultats de cette approche
Nous précisons les contraintes qui en résultent pour les chaînes de traitement de corpus au regard des propositions existant dans le domaine
de Traitement Automatique des Langues TAL suppose de maîriser l'homogénéité lexicale morphosyntaxique et syntaxique des données utilisées.
Cela implique en amont le développement d'outils de calibrage de textes.
Nous mettons en place de tels outils et la méthodologie associée dans le cadre de l'appel d'offres ELRA "Contribution à la réalisation
de corpus du français contemporain"
Nous montrons sur les rubriques principales du journal Le Monde les premiers réultats de cette approche
Nous précisons les contraintes qui en résultent pour les chaînes de traitement de corpus au regard des propositions existant dans le domaine
Origine : Fichiers produits par l'(les) auteur(s)
Loading...