Outils et méthodes de recherche en acquisition du langage : de la complémentarité entre statistiques et analyse linguistique - HAL Accéder directement au contenu
Communication dans un congrès Année : 2008

Outils et méthodes de recherche en acquisition du langage : de la complémentarité entre statistiques et analyse linguistique

Résumé

Although somewhat neglected by the first developmental psycholinguists, the methodology of compilation, transcription, and presentation of data on child language development has been a topic of discussion at least from the late seventies onwards, since many variables are introduced in each stage of this process. They have become a new focus of attention since 1984, thanks to the CHILDES (Child Language Data Exchange System) project 1. The ensuing use of similar tools and basic conventions (the CHAT format) by most researchers has certainly contributed to making transcriptions a more reliable "text", as well as one that can be shared and used for different purposes. The CLAN programs have also eased coding, morpho-syntactic analyses, frequency counts, etc. But at the same time, interfering variables have not been eliminated altogether, and generalizations have become more and more difficult with the increasing amount and variety of data used (e.g. in cross-linguistic comparisons). We propose that one way of addressing these issues is to have statistics go hand in hand with detailed, linguistic analyses. In order to illustrate this view, we describe and discuss the creation and use of an enriched transcription format within the Léonard project 2. We then provide one example of semantic coding (spatial vs. functional prepositions) and discuss the impact of categorization on statistical counts.
Même si les premiers travaux de psycholinguistique développementale n'y prêtaient que peu d'attention, les méthodes de compilation, de transcription et de présentation des données ont été très discutées depuis la fin des années soixante dix, en raison des nombreuses variables intervenant à chaque étape du processus. Avec le lancement du projet CHILDES en 1984 ces méthodes ont été revues pour permettre l'adoption d'un format unique (CHAT), faisant des transcriptions un « texte » plus fiable, mais aussi réutilisable et partageable. Les programmes de CLAN ont aussi permis d'automatiser les procédures de codage, d'analyse morpho syntaxique, et les calculs de fréquence. Mais ce faisant les observables sont devenus plus complexes, et les généralisations plus ardues, du fait même de la pluralité des corpus accessibles. Nous proposons ici une approche des données basant les statistiques sur des analyses linguistiques minutieuses. Deux types d'illustrations en seront données. Nous présenterons et discuterons d'abord la création, dans le cadre du projet Léonard, d'un format de transcription enrichi permettant de condenser dans le « texte » le maximum d'informations tout en réduisant la part des choix, toujours subjectifs Nous montrerons ensuite l'impact des catégorisations utilisées ou produites par le chercheur, à travers la présentation d'une procédure de codage sémantique des premières prépositions.
Fichier principal
Vignette du fichier
8. JADT rossi-morgenstern 2008.pdf ( 713.74 Ko ) Télécharger
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

halshs-01970586, version 1 (15-01-2019)

Identifiants

  • HAL Id : halshs-01970586 , version 1

Citer

Caroline Rossi, Aliyah Morgenstern. Outils et méthodes de recherche en acquisition du langage : de la complémentarité entre statistiques et analyse linguistique. 9e Journées internationales d'Analyse statistique des Données Textuelles (JADT), Mar 2008, Lyon, France. ⟨halshs-01970586⟩
104 Consultations
201 Téléchargements
Dernière date de mise à jour le 20/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus