ON COUNTING MEANINGFUL UNITS IN TEXTS - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 1995

ON COUNTING MEANINGFUL UNITS IN TEXTS

Résumé

We analyse a sample text. By identifying compounds and other sequences of words between which strong dependencies hold, we embed simple words that have no meaning by themselves into larger units that do carry specific meaning. Hence, the counts of simple words, and those of the units marked by our method become quite different. The analysis presented is operational to a large extent.
L'analyse syntaxique automatique, première étape d'une procédure d'interprétation fine des textes par ordinateur, a recours à des outils comme les grammaires et les dictionnaires. Ces outils, tels qu'ils sont actuellement disponibles, ne sont pas suffisants. Ils doivent en effet prendre une forme électronique qui impose des révisions majeures de leur forme et contenu. Nous présentons une méthodologie linguistique qui a permis de construire des outils électroniques à large couverture des langues. Ces nouveaux outils mettent en évidence des unités linguistiques signifiantes, ce qui conduit à une modification substantielle de l'analyse du contenu des textes.
Fichier principal
Vignette du fichier
Rome.pdf (247.62 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00278312 , version 1 (11-05-2008)

Identifiants

  • HAL Id : halshs-00278312 , version 1

Citer

Maurice Gross. ON COUNTING MEANINGFUL UNITS IN TEXTS. JADT, 1995, Rome, Italy. pp.5-18. ⟨halshs-00278312⟩

Collections

UNIV-PARIS7 CNRS
120 Consultations
183 Téléchargements

Partager

Gmail Facebook X LinkedIn More