Ne jetons pas le Wiktionnaire avec l'oripeau du Web ! Études et réalisations fondées sur le dictionnaire collaboratif

Résumé : Wiktionnaire est l'édition française de Wiktionnary, le dictionnaire libre multilingue accessible en ligne. Satellite de Wikipédia, dont il constitue le "compagnon lexical", le projet dictionnairique reste dans l'ombre de l'encyclopédie. Fondé comme elle sur le principe du wiki, il peut être alimenté et modifié par tout internaute, avec publication immédiate. Si la ressource encyclopédique a été abondamment utilisée dans certaines disciplines, le dictionnaire collaboratif semble avoir reçu moins d'attention de la part de la communauté scientifique. Ce moindre intérêt pourrait être le fruit d'une méconnaissance ou d'un rejet a priori de l'amateurisme que l'on associe volontiers aux contributions effectuées par des naïfs. Nous présentons dans cet article quelques caractéristiques du Wiktionnaire, ainsi que des réalisations issues de cette ressource. Ce travail entend illustrer les possibilités offertes par ce dictionnaire singulier et permettre de décider si l'on peut tirer ou non bénéfice de son exploitation, et pour quel usage. Plus précisément, nous questionnons la légimité des ressources approvisionnées "par les foules" et nous étudions dans quelle mesure le Wiktionnaire peut, par ses spécificités, compléter les ressources dictionnairiques existantes dans le cadre d'études linguistiques et, d'autre part, servir de point de départ à la constitution d'un lexique électronique pour des domaines comme le traitement automatique des langues et la psycholinguistique. Notre contribution à la caractérisation du Wiktionnaire s'accompagne de la mise à disposition de deux lexiques construits à partir du dictionnaire collaboratif. Le premier est un lexique morphophonologique à très large couverture. Destiné notamment aux applications de TAL, nous donnons des exemples possibles d'utilisation en linguistique outillée. Le second est un lexique orienté vers la psycholinguistique. Dérivé du premier, il contient moins d'entrées, mais comprend pour chacune d'elle un ensemble d'informations habituellement utilisées dans cette discipline. Ces lexiques sont à la fois sont téléchargeables et interrogeables en ligne.
Type de document :
Communication dans un congrès
4ème Congrès Mondial de Linguistique Française (CMLF 2014), Jul 2014, Berlin, Allemagne. pp.663-680, 2014
Liste complète des métadonnées

Littérature citée [52 références]  Voir  Masquer  Télécharger

https://halshs.archives-ouvertes.fr/halshs-00969260
Contributeur : Franck Sajous <>
Soumis le : dimanche 27 juillet 2014 - 16:12:43
Dernière modification le : mercredi 23 mai 2018 - 17:58:05
Document(s) archivé(s) le : lundi 17 novembre 2014 - 16:24:30

Fichier

SajousEtAl-CMLF2014.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : halshs-00969260, version 1

Collections

Citation

Franck Sajous, Nabil Hathout, Basilio Calderone. Ne jetons pas le Wiktionnaire avec l'oripeau du Web ! Études et réalisations fondées sur le dictionnaire collaboratif. 4ème Congrès Mondial de Linguistique Française (CMLF 2014), Jul 2014, Berlin, Allemagne. pp.663-680, 2014. 〈halshs-00969260〉

Partager

Métriques

Consultations de la notice

585

Téléchargements de fichiers

243