L'Europe passe à l'IA pour les prévisions météo
Le Centre européen pour les prévisions météo à moyen terme intègre un modèle de machine learning en parallèle de son modèle historique basé sur la physique.

Pour faire des prévisions météo, faut-il préférer les modèles d'apprentissage automatique à ceux basés sur la physique ?
Google, Huawei et NVIDIA - avec respectivement GenCast, Pangu-Weather et FourCastNet - font partie des entreprises dont les travaux plaident dans ce sens. Le Centre européen pour les prévisions météorologiques à moyen terme (ECMWF) n'avait pas manqué d'y faire référence à l'heure de présenter sa propre initiative : AIFS (Artificial Intelligence Forecasting System). Les expérimentations avaient été lancées à l'automne 2023.
Un jalon important a été franchi cette semaine : un premier modèle est passé en phase opérationnelle. Il est nommé AIFS-Single et pour cause : il ne produit pour le moment qu'une prévision à la fois. Les modélisations d'ensemble sont sur la feuille de route ; comme, entre autres, les prévisions sous-saisonnières (à une cinquantaine de jours).
Les bénéfices de l'entraînement probabiliste
L'AIFS fonctionne en parallèle du modèle "historique" de l'ECMWF, à savoir l'IFS (Integrated Forecast System). Il opère à une résolution plus faible (28 km vs 9 km), avec les mêmes conditions initiales (combinaison d'une précédente prévision à court terme et d'environ 60 millions d'observations). Il effectue des prévisions à 6 heures, et au-delà par autorégression (jusqu'à 72 heures).
L'entraînement, effectué en boucle, repose essentiellement sur les données ERA5 - produites dans le contexte du programme spatial européen Copernicus - à partir de 1979. Pour aller vers des modélisations d'ensemble, l'ECMFW explore deux approches probabilistiques. L'une fondée sur la diffusion (la prévision résulte d'un débruitage). L'autre, sur le CRPS (indice continu de probabilité ordonnée).
Par rapport à un entraînement déterministe, la méthode diffusion est plus lourde, car elle suppose généralement bien plus d'étapes. La méthode CRPS l'est aussi, pour une autre raison : une surcharge impliquée par la propagation des membres d'ensembles. Si bien qu'à résolution équivalente, l'une et l'autre ont des empreintes comparables.
Pour ce qui est de l'inférence, le coût d'une prévision en mode diffusion est nettement plus important qu'en CRPS, parce que le modèle est appelé plusieurs fois par étape. L'ensemble reste toutefois nettement moins consommateur que les prévisions d'IFS. Il faut, par exemple, quelques minutes à AIFS-Diffusion pour réaliser sur un GPU A100 ce qu'IFS met une heure à produire avec 96 CPU AMD EPYC Rome. En termes d'énergie consommée par prévision, on nous annonce un rapport de 1 pour 1000.
Les biais des modèles probabilistes apparaissent par ailleurs moindres, ou tout du moins pas plus importants, que ceux d'IFS.
Des poids sous licence libre
La v1 d'AIFS-Single reprend l'architecture de la version expérimentale, mais des variables de sortie ont été ajoutées (taux de couverture nuageuse, équivalence en eau de la neige...) et le régime d'entraînement a été revu. Le fine-tuning, en particulier, a monopolisé davantage de données. À la clé, selon l'ECMWF, de meilleures prévisions des précipitations, entre autres. En outre, l'écart de performance par rapport à IFS sur les trajectoires des cyclones tropicaux a été maintenue.
Le modèle a été formé sur Leonardo, un supercalculateur EuroHPC localisé en Italie. Les poids sont publiés sous licence libre (CC BY 4.0), en parallèle d'une boîte à outils Anemoi ("vents" en grec) qui comprend de quoi préparer des données, entraîner des modèles et les exécuter. L'ECMWF précise qu'en raison du caractère non déterministe des GPU, il ne sera pas possible de reproduire exactement ses prévisions.
Lire aussi : Les LLM autorégressifs ont-ils fait leur temps ?
Illustration © Mclek - Shutterstock
Sur le même thème
Voir tous les articles Data & IA