Les analyseurs morpho-syntaxiques du français:
- L'analyseur du GREYC
- FIPS
- au MLTT de XEROX
Les étiqueteurs:
- le projet SSCLes ressources:
- MEMODATA
- action GRACE
- projet EAGLES
- projet MULTEXT
- BDLEXLes organisations:
- ATALA
- ELRALes démos:
- FIPS
- GBGen
- L'analyseur du GREYC
- LemVortex
- SSCP
- ERGO Parser
- analyseurs de XEROXLes pages de liens:
- La page de liens du CNRS
- Les logiciels
- ACL NLP/CL Universe
Analyseur morpho-syntaxique |
|
|
Cet analyseur est développé par Emmanuel Giguet et Jacques Vergne du groupe GREYC de l'Université de Caen. Il est basé sur l'utilisation des syntagmes et les déductions contextuelles. Cet analyseur est à ce jour le plus performant selon son évaluation par l'action GRACE au CNRS. Un visualiseur d'analyses syntaxiques est utilisable sous forme d'applet Java. Vous trouverez ici les publications d'Emmanuel Giguet. |
Analyseur morpho-syntaxique |
|
|
FIPS est un analyseur dérivé d'IPS, un analyseur de l'anglais développé par le LATL de l'Université de Genève. Le projet IPS a permis de définir des modules communs à toutes les langues, basés sur la théorie GB (une démo de GBGen est ici) . Des modules spécifiques sont ensuite ajoutés selon la langue à analyser. Découlent de ces recherches I-IPS pour l'italien et DIPS pour l'allemand. FIPS peut être utilisé ici. |
Étiqueteur grammatical |
|
|
Un analyseur en Java à but éducatif et facile d’accés développé par le Syntax Student's Companion. Les résultats d’analyse sont sous forme d’arbres syntaxiques. Le lexique français est pour l'instant sommaire. Vous pouvez utiliser l'application ici et la télécharger ici. |
Outils |
|
|
MEMODATA est une entreprise française développant des outils d’aide au traitement automatique du langage. On y trouve notamment des packages pour java et de nombreux lexiques. |
Ressources |
|
|
Menée par le TLP du CNRS, l'action GRACE vise à l’évaluation des analyseurs morpho-syntaxiques du français. Cette évaluation se fait à partir d'un corpus de "Le Monde" étiqueté manuellement. |
Ressources |
|
|
Le but du projet BDLEX est de rendre disponibles les matériaux lexicaux utilisés pour l'assistance linguistique au traitement de textes ou dans différents systèmes de communication homme-machine en langage naturel écrit et/ou oral. BDLEX comprend des lexiques, des composantes phonologiques et morphologiques(LemVortex), ainsi que des linguisticiels. |
Ressources |
|
|
Basé sur les ressources d'EAGLES, Multext (au LPL) comprend une série de projets dont les buts sont de développer des standards pour l'annotation de corpus et de développer des outils, corpus et ressources basés sur ces standards. A l'instar d'EAGLES, Multext concerne un large éventail de langues. Tous les résultats de Multext sont disponible de manière publique. |
Ressources |
|
|
Le but du projet EAGLES est de définir des normes d'étiquetage grammatical et d'annotation de corpus pour de nombreuses langues dont l'anglais, le français, l'italien, l'allemand,etc ... de manière à pouvoir offrir d'amples ressources réutilisables pour le développement d'outils multilingues. |