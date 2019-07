Ça y est, la Ligue 2 a sonné la reprise officielle des compétitions en France ! Après quelques journées de Ligue 1, de Premier League, de Bundesliga, de Liga ou de Serie A, l'Observatoire du football CIES devrait donc encore présenter ses prédictions sur les vainqueurs des différents championnats. Mais comment la structure se débrouille-t-elle pour avoir (souvent) raison, et quels sont les secrets mathématiques cachés derrière tout ça ?

L'importance du passé... et des maths

Le cerveau informatique

Très chères données

Se tromper, c'est être en vie

C'était il y a seulement quelques mois, même si cela paraît bien loin dans les esprits des amateurs de football à l'heure où les cinq grands championnats s'apprêtent à repartir pour un nouvel et énième exercice. En janvier 2019, l'Observatoire du football CIES présentait dans sa lettre hebdomadaire ses prédictions pour la deuxième partie de saison. Pour lui, les résultats finaux ne faisaient (quasiment) aucun doute : le Paris Saint-Germain, la Juventus et Barcelone, mais aussi Manchester City et le Bayern Munich (sept et six points derrière Liverpool et le Borussia Dortmund, à l'époque) seraient respectivement sacrés rois de leur pays au mois de mai. Bingo.Pas une première pour la structure réputée pour ses capacités prédictives, qui avait également vu dans sa boule de cristal numérique que Monaco (alors devant le PSG, mais derrière Nice en janvier 2017) serait couronné et que Lille s'installerait sur le trône en 2011. C'est que l'Observatoire a mis en place un modèle statistique efficace, lui permettant d'établir le nombre de points que devrait obtenir chaque club lors de la seconde partie de la saison. Autrement dit, il sait mathématiquement quelle équipe a sur-performé et qui a sous-performé. Idéal, pour avancer un pronostic loin d'être hasardeux. Cet hiver, l'unité créée par la FIFA devrait donc encore une fois dire si le Bayern va conserver son titre, si l'Olympique lyonnais réussira à se qualifier en Ligue des champions ou si Sheffield United parviendra à se maintenir en Premier LeagueL'année dernière, l'Observatoire n'avait pas caché les outils mesurés de sa réussite. À savoir trois familles de deux critères : performances défensives (nombre de buts concédés, nombre de tirs concédés depuis l'intérieur de la surface), performances offensives (nombre de buts inscrits, nombre de tirs déclenchés depuis l'intérieur de la surface), emprise sur le jeu (nombre de passes réussies, nombre de passes réussies dans le camp adverse). Sauf qu'une information a pu être reléguée au second plan : elle rappelle que ces critères sont observés sur la première moitié du championnat, mais aussi (et surtout ?) sur les cinq dernières saisons.Pas une surprise pour Paul Sada, mathématicien spécialisé dans les algorithmes de prédiction liés au football : «» Aussi à l'aise dans le milieu des chiffres footballistiques que Cristiano Ronaldo devant une cage, l'expert continue : «(loi de probabilité qui décrit le comportement du nombre d'événements se produisant dans un intervalle de temps fixé, N.D.L.R.)Alors concrètement, comment ça fonctionne ? D'abord, le moindre petit critère est testé afin de juger son importance manifeste sur le résultat d'un match. Si le nombre de passes réussies de Lionel Messi pour Ousmane Dembélé dans le camp adverse est statistiquement davantage lié à la victoire que le nombre de corners frappés directement par Ivan Rakitić, le critère « nombre de passes réussies de Lionel Messi pour Ousmane Dembélé dans le camp adverse » aura plus d'influence dans l'équation algorithmique créée à la fin... Même si globalement, les critères étudiés et soumis à la loi de Poisson sont un poil moins précis., reprend Paul Sada, lui-même créateur d'un impressionnant système d'algorithme appelé L'Algo de Paulo Les données de base de chaque critère, hyper précises et réclamées par de nombreux clubs de foot, sont vendues par des entreprises spécialisées (celles utilisées par l'Observatoire proviennent par exemple de l'InStat) et peuvent mettre des chiffres sur n'importe quoi. Mouvements d'un joueur dans le premier quart d'heure, kilomètres parcourus dans le dernier, tacles subis dans le rond central... Calculer le nombre de fois où Karim Benzema se gratte le crâne ou la fréquence de lever de sourcil de Carlo Ancelotti serait même possible, si cela était demandé. Pas pour rien que l'abonnement à l'offre de ces entreprises peut monter jusqu'à 1500 euros par mois.Reste que ces données ne semblent pas fructueuses pour les compétitions internationales, sur lesquelles les prédictions se pètent régulièrement les dents. Pour la Coupe du monde 2018, des banques s'étaient prises au jeu, mais quasiment aucun algorithme n'avait réussi à faire de la France le lauréat de la planète. Pas même celui de l'Observatoire, qui avait placé les Tricolores en troisième position derrière l’Espagne et le Brésil. «, pose le mathématicien.Un mal pour un bien ? Peut-être bien. «, sourit Paul Sada.» Effectivement, même en se transformant en petite souris pour tout connaître du vestiaire, difficile d'appliquer un chiffre ou un pourcentage à un algorithme pour poser l'influence d'une embrouille John Terry-Wayne Bridge ou d'une aventure Estelle Denis-Ludovic Giuly., conclut le créateur d'algorithme.» Tant que les robots ne sont que d'un côté...