Il n’y a pas [encore] d’analyseur de texte fiable pour des textes qui ne sont pas pré-formatés ou convenus.
Les texte de Loi ont tous le même niveau de complexité : langage juridique, expressions/tournures/formulations encadrées par un jargon ancestral, malgré les efforts fait récemment pour que tout texte réglementaire soit intelligible par tous.
Une analyse de texte ne se fait pas avec des statistiques de taille, de fréquence, de positionnement et des métrages divers, mais sur le sens des mots qui ont souvent deux ou trois définitions possibles et autant ou sinon plus de nuances selon le mot accolé, la place dans la phrase ou son contexte.
De plus les sous-entendus peuvent être nombreux, les exceptions variées et pas toujours très compréhensibles…
Chacun a sa vision selon son niveau d’apprentissage, son goût ou non pour la littérature, l’expression artistique, l’expression médiatique…
Le plus simple est de prendre les livres pour enfants, de la maternelle au collège, et de voir les mots employés, l’évolution des phrases, des définitions, et d’en parler avec quelqu’un qui enseigne la langue, qui vous dira sur quels problèmes buttent les élèves.
Industrialiser ou automatiser le processus vous fera perdre l’expérience des lecteurs qui d’un regard sur deux ou trois pages d’un livre peuvent vous donner des indices et les adapter à ceux que vous avez en tête.
D’autant plus que les langues latines et anglo-saxonnes n’ont pas les mêmes affects, la lecture est un problème humain, donc à la fois universel et unique : aucun texte n’est compris exactement de la même manière par deux personnes différentes.
Leave a comment