Corneille Molière
Controverse sur l'utilisation d'algorithmes pour déterminer la paternité d'une oeuvre

Mikhail Marusenko et Elena Radionova

Éléments biographiques

Elena Radionova est lauréate de l’université d’Etat de Saint Petersburg. Elle s’intéresse aux sciences philologiques et fut diplômée, Docteur en 2008, par le département linguistique mathématique. Mme Radionova était encadrée par M. Mikhail Marusenko, le chef du département des langues romaines de la même université.

Position dans la controverse

Bien que loin de la France, les russes s’intéressent beaucoup à la culture française. Ils suivent de près les péripéties et les débats autour de cette culture, et plus particulièrement le thème théâtral. C’est dans ce contexte que le département de linguistique mathématique de l’université d’Etat de Saint Petersburg vient interférer dans une controverse qui a fait beaucoup de bruit en France, celle de la Paternité des Œuvres de Molière. Le Journal of Quantitative Linguistics, dans son dix-septième volume paru en 2010, publia l’article Mathematical Methods for Attributing Literary Works when solving the “Corneille-Molière” Problem. Les deux chercheurs russes, cités plus haut, s’appuient sur des modélisations mathématiques et des quantifications stylistiques pour les textes littéraires. Leur méthode décide de la paternité des œuvres suite à une analyse lexicale et syntaxique.

L’article commence par saluer l’effort de Monsieur Dominique Labbé qui a mis au point sa méthode de distance intertextuelle, à partir d’une analyse du champ lexical répondu dans les œuvres. Il objecte tout de même que le critère lexical ne être fiable pour une classification nette des œuvres. Le champ lexical étant, d’après lui, facilement imitable. L’algorithme mathématique proposé par les russes se veut plus apte à décider de la paternité des œuvres de Molière puisque il englobe la partie lexicale et celle syntaxique en prenant des indices de calcul tels que : X02 (nombre des phrases simples), X04 (nombre des phrases complexes), X21 (nombre des verbes conjugués), et X31 (nombre des sujets).

Le document publié par les chercheurs russes développe un modèle mathématique qui parts d’une hypothèse philologique, due à des considérations historiques, d’attribution. L’algorithme implémenté par la suite devra vérifier cette hypothèse ou, dans le cas contraire, l’hypothèse est considérée fausse, elle est modifiée. Les méthodes statistiques et probabilistes sont des suppléants qui quantifient notre incertitude sur la paternité d’une œuvre ou d’une autre.

Concrètement, l’hypothèse de calcul choisie par Mme Radionova part d’une classification des œuvres, dites de Molière, en deux classes : celle de Corneille (Ω1) et celle de Quinault (Ω2). Ω1 contient à priori 11 textes tandis que Ω2 en contient 3 sans rien attribuer à Molière. L’algorithme russe conclut que : plusieurs pièces théâtrales signées par Molière sont probablement écrites par Corneille ou par d’autres écrivains français (Quinault). Et plus précisément :

  1. Dix pièces ont été attribuées à la classe Ω1(Corneille) dont : Le Dépit amoureux, L’École des Maris, Les Fâcheux, L’École des Femmes, Tartuffe, Les Femmes savantes, avec par une probabilité supérieure à 0,95. Ce calcul a aussi attribué Sganarelle, Le Misanthrope, Mélicerte, La Pastorale comique avec une probabilité de 0,63 à 0,73.
  2. La pièce L’Étourdi peut être attribuée à la classe Ω2 (Quinault) avec la probabilité de 0,68.
  3. Les pièces Dom Garcie de Navarre et La Princesse d’Elide n’appartenant ni à Ω1 (Corneille) ni à Ω2 (Quinault), elles constituent la classe Ω3 a posteriori indépendante.

Travaux scientifiques

  • 2004 — Mémoire de fin d’études : « Attribution d’articles anonymes et pseudonymes publiés dans les magazines Vremja et Epoque de 1861 à 1865 »
  • 2008 — Thèse soutenue : « Méthodes linguistiques d’attribution et de datation (sur l’exemple de «l’affaire Corneille-Molière») »
  • 30 Mars 2010, Journal of Quantitative Linguistics, «Mathematical Methods for Attributing Literary Works when solving the “Corneille-Molière” Problem »