Sémantique interprétative et analyses automatiques de textes : que deviennent les sèmes ? - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Article Dans Une Revue Sémiotiques Année : 1999

Sémantique interprétative et analyses automatiques de textes : que deviennent les sèmes ?

Résumé

Semes are usually understood as semantic primitives, in order to describe meanings. As for F. Rastier, semes are contextually defined, and are the result of an interpretative path. This modelisation accounts for successes and limits of some statistical and distributional approaches. Some of the mathematical properties implied are not linguistically appropriate, so that the processing has to be defined on new bases. Text semantics also sheds new light on NLP tools and processes : dictionaries, taggers, corpus. A new clustering method is proposed as a means to modelize isotopies, and thus texts topics. These computed semantic classes are inherently different from the ones manually defined by experts.
Le sème est souvent compris comme une primitive utilisable pour décrire les sens des mots. Or, tel que le présente F. Rastier, il est défini par et dans un contexte, et apparaît comme le résultat de l'interprétation d'un texte. Cette conception du sème permet de comprendre les succès et les limites d'analyses statistiques ou distributionnelles de textes. Certaines propriétés mathématiques des modélisations se révèlent linguistiquement inadéquates ; choisir le cadre de la sémantique interprétative conduit alors à redéfinir les traitements par-delà le seul ajustement des paramètres. Cette perspective oriente également certains choix concernant les outils et les étapes du TAL : dictionnaires, analyseurs morpho-syntaxiques, corpus et étiquetage. Un nouveau mode de classification automatique est présenté, comme moyen de repérage et de représentation des isotopies et donc de la thématique d'un texte. Ces classes sémantiques calculées sont d'une autre nature que celles définies par des experts.
Fichier principal
Vignette du fichier
pincemin_semiotiques02.pdf (434.45 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

halshs-00367164 , version 1 (10-03-2009)

Identifiants

  • HAL Id : halshs-00367164 , version 1

Citer

Bénédicte Pincemin. Sémantique interprétative et analyses automatiques de textes : que deviennent les sèmes ?. Sémiotiques, 1999, 17, pp.71-120. ⟨halshs-00367164⟩
353 Consultations
2372 Téléchargements

Partager

Gmail Facebook X LinkedIn More