26 septembre 2023

L’intelligence artificielle a-t-elle démodé les outils statistiques ?

Background. Machine learning is increasingly advocated to develop prediction models for postoperative complications. It is, however, unclear if machine learning is superior to logistic regression when using structured clinical data. Postoperative pancreatic fistula and delayed gastric emptying are the two most common complications with the biggest impact on patient condition and length of hospital stay after pancreatoduodenectomy. This study aimed to compare the performance of machine learning and logistic regression in predicting pancreatic fistula and delayed gastric emptying after pancreatoduodenectomy. Methods. This retrospective observational study used nationwide data from 16 centers in the Dutch Pancreatic Cancer Audit between January 2014 and January 2021. The area under the curve of a machine learning and logistic regression model for clinically relevant postoperative pancreatic fistula and delayed gastric emptying were compared. Results. Overall, 799 (16.3%) patients developed a postoperative pancreatic fistula, and 943 developed (19.2%) delayed gastric emptying. For postoperative pancreatic fistula, the area under the curve of the machine learning model was 0.74, and the area under the curve of the logistic regression model was 0.73. For delayed gastric emptying, the area under the curve of the machine learning model and logistic regression was 0.59. Conclusion. Machine learning did not outperform logistic regression modeling in predicting postoperative complications after pancreatoduodenectomy.

Commentaire du Dr Marius Laurent (PAQS)

  • Les auteurs s’attachent à la prédiction de complications après pancréatectomie (vidange gastrique retardée, fistules) à partir d’un registre aux Pays Bas qui reprend toutes les pancréatectomies réalisées dans le pays. Cette prédiction peut guider l’indication chirurgicale si elle est obtenue tôt, ou la surveillance et la prévention des complications si elle est réalisée pendant ou après l’intervention. La régression logistique est la méthode classique et éprouvée, elle a des faiblesses. Les paramètres utiles doivent être connus, et surtout, elle implique une proportionnalité d’effet entre le paramètre causal et son effet. Les modèles basés sur l’intelligence artificielle (IA) et l’apprentissage par la machine ne sont pas soumis à ce diktat. Par contre, le mode de classification qu’ils suggèrent est opaque et non explicable par l’observateur humain : ce dernier est dans l’impossibilité de le justifier. Dans l’exemple analysé, l’IA ne fait pas mieux que la statistique, et l’une et l’autre sont décevantes. Sans doute, les restrictions qu’impose le protocole de cette étude défavorisent-elles l’IA : peu de paramètres accessibles, trop de paramètres discrets ne permettent pas de construire et exploiter un espace multidimensionnel dont l’IA a le secret. L’IA peut toutefois acquérir de l’expérience et s’améliorer, tenir compte d’un poids différent de chaque variable en fonction de caractéristiques personnelles du patient qu’elle peut déceler. En attendant, il n’est pas encore l’heure de jeter les méthodes statistiques classiques à la poubelle.

Ingwersen EW, Stam WT, Meijs BJV, et al.Machine learning versus logistic regression for the prediction of complications after pancreatoduodenectomy. Surgery 2023;174(3):435-440. Doi : 10.1016/j.surg.2023.03.012.