Il avait déjà été dit que les mots rares permettraient d'ordonner chronologiquement les pièces de Shakespeare. Mais en faisant une étude sur la rareté des mots de plusieurs auteurs anglophones, on a découvert que chaque auteur avait un rapport entre les mots rares et les plus communs différente, une sorte d'ADN littéraire. Ce qui est curieux, c'est que ce rapport est similaire entre les textes courts et les longs.
Les chercheurs derrière cette étude statistique sont en train de se faire une banque de textes dans plusieurs langues, pour tester leur théorie sur différentes langues, pour voir si les proportions entre les différents mots rares sont uniques, ou simplement diversifiés. Si cela fonctionne vraiment, j'aimerais qu'on teste la fiction versus la vulgarisation scientifique d'Asimov, les articles de journal versus les oeuvres de Zola, pour voir si l'ADN est relative au contexte.
Aucun commentaire:
Publier un commentaire