Corneille Molière
Controverse sur l'utilisation d'algorithmes pour déterminer la paternité d'une oeuvre

Charles Bernet


Éléments biographiques

Charles Bernet est linguiste et lexicographe. Il a publié l’Analyse statistique et a collaboré au Trésor de la langue française.

Position dans la controverse

La démarche de Charles Bernet est d’utiliser la méthode de Cyril et Dominique Labbé pour essayer d’éclairer certains points et d’en questionner d’autres plus obscurs. Il ne s’intéresse absolument pas à l’approche historique ni littéraire de la controverse. Il va de plus étendre les tests à un autre corpus que celui de Corneille et de celui de Molière. En effet, il ajoute trois comédies : l’Intrigue des filous de Claude de l’Estoile (1648), le Distrait (1698) et le Légataire universel (1708) de Jean-François Regnard et trois tragédies : Astrate, roi de tyr de Philippe Quinault (1665), Ariane de Thomas Corneille (1672), le frère de Pierre Corneille et Électre de Longepierre (XVIIIième siècle).

En suivant la méthode de Dominique Labbé, il apparaît par exemple que les comédies de Regnard soient aussi proches (au sens des Labbé : distance inférieure à 0.25) de certaines pièces de Molière que ces dernières le sont de celles de Corneille. D’après M. Bernet, cela montre que la proximité des textes de Corneille et de ceux de Molière n’est pas une exception et cela invalide l’attribution des œuvres par simple calcul de distance inter-textuelle.

Malgré tout, M. Bernet affirme que la méthode de Dominique Labbé peut s’avérer efficace si la différence de longueur entre les textes étudiés n’est pas trop grande. De plus, il remet en cause la lemmatisation en affirmant que cela détruit le choix de l’auteur. Il utilise donc une version de l’algorithme où il garde les mots à la rime sous leur forme originelle et obtient donc logiquement des distances plus grandes entre les textes et ainsi les œuvres de Corneille et de Molière sont bien mieux séparées.

Charles Bernet ne remet donc pas en cause la nature même de la distance intertextuelle. il insiste néanmoins sur plusieurs points. Premièrement la lemmatisation est une simplification trop extrême, effaçant la personnalité de l’auteur. Deuxièmement, la notion de seuil pour déterminer si deux textes sont d’un même auteur est trop faible et arbitraire. Enfin, cette méthode est trop sensible aux différences de longueurs des textes.

Œuvres significatives

  • Charles Bernet, « La distance intertextuelle et le théâtre du Grand Siècle » in Mélanges offerts à Charles Muller pour son centième anniversaire (22 septembre 2009), textes réunis par Christian Delcourt et Marc Hug, Paris, CILF, 2009.
  • Charles Bernet, « Hasards de la rime » in Le Poids des mots, actes des septièmes Journées internationales d’analyse statistique des données textuelles, Presses universitaires de Louvain, 2004, vol. 1.

Arguments

La d ́marche de Charles Bernet est d’utiliser la m ́thode de Cyril et Do-
e
e
minique Labb ́ pour essayer d’ ́clairer certains points et d’en questionner
e
e
d’autres plus obscures. Il ne s’int ́resse absolument pas a l’approche histo-
e
`
rique ni litt ́raire de la controverse. Il va pour cela  ́tendre les tests a un
e
e
`
autre corpus que celui de Corneille et de celui de Moli`re.