Évolutions de la linguistique outillée : méfaits et bienfaits du TAL

Résumé : Cet article examine l'impact des technologies du traitement automatique des langues (TAL) sur les pratiques de la linguistique outillée, au sens de (Habert 2004). Cette linguistique qui s'est dotée de nouveaux instruments d'observation et de calcul est largement alimentée par les méthodes définies dans le champ du TAL, héritant ainsi des évolutions de cette discipline pour le meilleur et pour le pire. En effet, si la linguistique a l'opportunité d'intégrer dans son outillage des instruments plus sophistiqués basés sur des approches quantitatives et des données plus diverses et plus nombreuses, elle a néanmoins des difficultés à se les approprier et à contribuer en retour aux avancées du TAL. Nous rendons compte dans cet article de ce bilan contrasté. Nous présentons tout d'abord un rapide panorama des évolutions récentes, en évoquant notamment la façon dont le développement des méthodes quantitatives du TAL a modifié la place dévolue à la linguistique dans cette discipline. Nous exposons les problèmes que nous percevons actuellement~: un TAL à l'outillage trop complexe et opaque pour être appréhendé pleinement par des linguistes, des linguistes dont le rôle se cantonne à l'annotation de données d'entraînement ou d'évaluation, des applications qui simplifient la définition des objets langagiers en misant sur la massification des données pour les traiter. La deuxième partie s'intéresse à l'impact, cette fois plus positif, qu'ont eu ces évolutions majeures du TAL sur la méthodologie des recherches en linguistique. Elles se traduisent par la possibilité de faire appel à de nouvelles méthodes d'expérimentation et de reconsidérer les phénomènes langagiers à la lumière de données à grande échelle, assorties de méthodes d'observation plus efficaces. La dernière partie suggère une voie permettant à la linguistique ainsi outillée de jouer pleinement son rôle face à de nouvelles demandes exprimées par des acteurs externes (autres disciplines, entreprises, institutions, etc.). Ces demandes, de natures diverses, ne semblent en effet pas adaptées aux exigences du TAL quantitatif qui s'est concentré sur quelques applications centrales. La linguistique outillée garde alors sa spécificité et son avantage dans des situations qui requièrent des connaissances linguistiques et un traitement plus riche du matériau langagier. Dans ce genre de situation, parce qu'elle a bénéficié des avancées récentes du TAL, la linguistique est aujourd'hui à même d'intervenir efficacement sur de grandes quantités de données et de dialoguer avec d'autres disciplines et acteurs de terrain. Elle a alors l'opportunité de faire émerger des problématiques linguistiques sur des données souvent très riches, et de traiter des questions nouvelles, dont nous donnons plusieurs exemples.
Document type :
Journal articles
Complete list of metadatas

Cited literature [7 references]  Display  Hide  Download

https://halshs.archives-ouvertes.fr/halshs-01057493
Contributor : Ludovic Tanguy <>
Submitted on : Friday, August 22, 2014 - 4:57:27 PM
Last modification on : Tuesday, March 19, 2019 - 2:02:00 PM
Long-term archiving on : Thursday, November 27, 2014 - 1:50:42 PM

File

Tanguy-Fabre-IG142-correction....
Files produced by the author(s)

Identifiers

  • HAL Id : halshs-01057493, version 1

Collections

Citation

Ludovic Tanguy, Cécile Fabre. Évolutions de la linguistique outillée : méfaits et bienfaits du TAL. L'information grammaticale, Peeters Publishers, 2014, pp.15-23. ⟨halshs-01057493⟩

Share

Metrics

Record views

956

Files downloads

353