Analyse syntaxique: les liens intéressants

Les analyseurs morpho-syntaxiques du français:
    - L'analyseur du GREYC
    - FIPS
    - au MLTT de XEROX

Les étiqueteurs:
     - le projet SSC
Les ressources:
     - MEMODATA
     - action GRACE
     - projet EAGLES
     - projet MULTEXT
     - BDLEX
Les organisations:
     - ATALA
     - ELRA
Les démos:
     - FIPS
     - GBGen
     - L'analyseur du GREYC
     - LemVortex
     - SSCP
     - ERGO Parser
     - analyseurs de XEROX

                 Les pages de liens:
                         - La page de liens du CNRS
                         - Les logiciels
                         - ACL NLP/CL Universe

Pour m'envoyer un message:

Dernière mise à jour: 21 Janvier 2000

Analyseur morpho-syntaxique

L'analyseur du GREYC

langue: français

Cet analyseur est développé par Emmanuel Giguet et Jacques Vergne du groupe GREYC de l'Université de Caen. Il est basé sur l'utilisation des syntagmes et les déductions contextuelles. Cet analyseur est à ce jour le plus performant selon son évaluation par l'action GRACE au CNRS. Un visualiseur d'analyses syntaxiques est utilisable sous forme d'applet Java. Vous trouverez ici les publications d'Emmanuel Giguet.

Analyseur morpho-syntaxique

FIPS

langue: français

FIPS est un analyseur dérivé d'IPS, un analyseur de l'anglais développé par le LATL de l'Université de Genève. Le projet IPS a permis de définir des modules communs à toutes les langues, basés sur la théorie GB (une démo de GBGen est ici) . Des modules spécifiques sont ensuite ajoutés selon la langue à analyser. Découlent de ces recherches I-IPS pour l'italien et DIPS pour l'allemand. FIPS peut être utilisé ici.

Étiqueteur grammatical

The Syntax Student's Companion project

langue: anglais, français, espagnol

Un analyseur en Java à but éducatif et facile d’accés développé par le Syntax Student's Companion. Les résultats d’analyse sont sous forme d’arbres syntaxiques. Le lexique français est pour l'instant sommaire. Vous pouvez utiliser l'application ici et la télécharger ici.

Outils

MEMODATA

langue: français

MEMODATA est une entreprise française développant des outils d’aide au traitement automatique du langage. On y trouve notamment des packages pour java et de nombreux lexiques.

Ressources

GRACE

langue: français

Menée par le TLP du CNRS, l'action GRACE vise à l’évaluation des analyseurs morpho-syntaxiques du français. Cette évaluation se fait à partir d'un corpus de "Le Monde" étiqueté manuellement.

Ressources

BDLEX

langue: français

Le but du projet BDLEX est de rendre disponibles les matériaux lexicaux utilisés pour l'assistance linguistique au traitement de textes ou dans différents systèmes de communication homme-machine en langage naturel écrit et/ou oral. BDLEX comprend des lexiques, des composantes phonologiques et morphologiques(LemVortex), ainsi que des linguisticiels.

Ressources

projet MULTEXT

langue: anglais

Basé sur les ressources d'EAGLES, Multext (au LPL) comprend une série de projets dont les buts sont de développer des standards pour l'annotation de corpus et de développer des outils, corpus et ressources basés sur ces standards. A l'instar d'EAGLES, Multext concerne un large éventail de langues. Tous les résultats de Multext sont disponible de manière publique.

Ressources

projet EAGLES

langue: anglais

Le but du projet EAGLES est de définir des normes d'étiquetage grammatical et d'annotation de corpus pour de nombreuses langues dont l'anglais, le français, l'italien, l'allemand,etc ... de manière à pouvoir offrir d'amples ressources réutilisables pour le développement d'outils multilingues.