Corneille Molière
Controverse sur l'utilisation d'algorithmes pour déterminer la paternité d'une oeuvre

Statistiques et littérature

Arguments statistiques

Il s’agit d’appliquer les méthodes de la statistique à l’étude de corpus littéraires.

• MM Labbé définissent la distance intertextuelle comme étant la différence entre le vocabulaire des deux textes. L’idée de base est de regarder l’ensemble des mots utilisés dans le premier, puis celui utilisé dans le second, et de faire un décompte des différences. Autrement dit, on juge du degré de dissemblance ou de ressemblance de deux textes. Pour cela on mesure la part des occurrences communes aux deux textes et on la ramène à l’ensemble des occurrences.

• Psyché et les deux Menteurs constituent un l’échantillon de « preuves » sur lesquelles MM Labbé appuient leur thèse. Ils soutiennent en effet à l’issue de leurs calculs: c’est Corneille qui aurait « probablement » écrit les œuvres dites de Molière…