Si « analyser » veut dire « étudier automatiquement d’un point de vue syntaxique, morphologique ou sémantique »
Il existe en fait déjà des dictionnaires et des lexiques conçus pour le TAL. Ma référence de base est le Lexique des Formes Fléchies du Français qui devrait largement suffire pour un petit projet.
Pour aller plus loin, le Lexique-Grammaire est à ma connaissance le lexique de français le plus complet existant, mais il est possible qu’il n’ait pas encore été totalement numérisé et distribué, ça fait quelques années que je ne l’ai pas touché.
Soit dit en passant, vérifie que tu ne réinventes pas la roue et que le logiciel que tu veux réaliser ou un équivalent n’existe pas déjà. Pour un état de l’art en TAL syntaxe et morphologie, la page de Benoît Sagot est un bon point de départ. Si tu as des questions précises, ping moi chez Cosette où dans lɪŋˈgwɪstɪks (puisque le TAL fait partie de leur portefolio).
Pourquoi ne pas s’appuyer sur dicollecte utilisé par Apache OpenOffice ou LibreOffice.
Il a le mérite d’être libre, mis à jour régulièrement et pérenne.
De plus il y a des passerelles, des routines, des paquets tous faits pour analyser et présenter les mots dans les traitements de texte cités.
Leave a comment