Skip to Main content Skip to Navigation
Conference papers

Capitalisation des savoirs par le web : une application de la TEI pour l'encodage et l'exploitation des textes de la Base de Français Médiéval

Résumé : Les questions relatives à la mise sur le web de corpus d'ancien et de moyen français se sont présentées à nous lors du transfert des textes de la Base de Français Médiéval sur le site français de l'ATILF. Jusqu'à présent, les textes de la Base de Français Médiéval n'étaient pas accessibles sur la toile. Ils étaient exploités par l'intermédiaire de concordances, réalisées au moyen du logiciel ANALYSER de Pascal Bonnefois, mais leur accès restait réservé.

Le transfert de ces textes et leur intégration dans la grande base FRANTEXT nous a donc fourni l'occasion de nous poser un certain nombre de questions méthodologiques. La transmission de données textuelles peut en effet s'envisager selon deux points de vue : on peut échanger des textes entre institutions ou collègues en laissant à chacun le choix des outils grâce auxquels ils les exploiteront, ou l'on peut accéder à des textes que l'on ne possède pas via une base de données interrogeable à distance. C'est le parti pris par les bases FRANTEXT et ARTFL notamment. Dans le cadre de notre accord avec l'ATILF, nous nous situons clairement dans le second cas de figure. Mais la question du mode de représentation des textes ne nous a pas paru secondaire pour autant. Nous présenterons, dans cet article, les modalités de représentation des textes utilisées nous garantissant un contrôle de la qualité des textes transmis à notre partenaire ainsi que de leur intégration dans notre propre outil d'analyse automatique WEBLEX.
Complete list of metadatas

Cited literature [5 references]  Display  Hide  Download

https://halshs.archives-ouvertes.fr/halshs-00151843
Contributor : Serge Heiden <>
Submitted on : Monday, June 11, 2007 - 4:08:14 PM
Last modification on : Saturday, August 29, 2020 - 3:00:32 AM
Long-term archiving on: : Thursday, April 8, 2010 - 6:58:12 PM

File

Ottawa-2003-02-01-23.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : halshs-00151843, version 1

Collections

Citation

Serge Heiden, Céline Guillot. Capitalisation des savoirs par le web : une application de la TEI pour l'encodage et l'exploitation des textes de la Base de Français Médiéval. colloque d'Ottawa, 4-5 oct. 2002, 2003, Ottawa, Canada. pp.77-92. ⟨halshs-00151843⟩

Share

Metrics

Record views

363

Files downloads

411