-
Les corpus ESLO (Enquête socio-linguistique orléanaise) 1 et 2, aussi connu sous le nom de corpus d’Orléans est le plus grand corpus de français oral. Il est transcrit et partiellement étiqueté. La version 1 date des années 60, la version 2 des environs de 2010.
-
En ce qui concerne les travaux sur les parties du discours le French Treebank de l’équipe d’Anne Abeillé est la référence.
-
Le corpus Frantext de l’Atilf est un corpus de français écrit de référence.
-
Le corpus Scientext est son équivalent pour les langages spécialisés, il est également disponible en anglais.
Leave a comment