Soutenance de thèse de Tiago DA SILVA BARROS

Tiago DA SILVA BARROS, soutiendra sa thèse de doctorat, le lundi 3 novembre 2025 à 10h au laboratoire i3S dans la salle 007 - bâtiment Euclide B -

 

La thèse intitulée « Optimisation des performances et de la consommation énergétique pour l’inférence dans le domaine de l’apprentissage automatique » a été réalisée dans le Pôle COMRED sous la direction de Frédéric GIROIRE et de Ramon APARICIO-PARDO. 

La présentation sera en anglais.

 

Résumé : 
Les progrès rapides de l’utilisation de l’IA ont conduit à une augmentation significative des besoins en calcul. 
L’émergence de nouveaux paradigmes de déploiement, tels que le MLaaS (Machine Learning as a Service), et la popularité croissante de Large Language Models (LLM) notables, tels que GPT, Gemini et Deepseek, ont intensifié cette demande. En conséquence, la consommation d’énergie associée aux modèles d’IA a considérablement augmenté, soulevant des inquiétudes quant à leur empreinte environnementale. 
Dans cette thèse, nous abordons la demande croissante en ressources et proposons des stratégies d’optimisation pour améliorer l’efficacité énergétique lors de l’inférence IA. Pour répondre à ces questions, nous abordons deux problèmes. Dans le premier, nous considérons un système comportant plusieurs tâches d’inférence avec des délais stricts qui doivent être planifiées sur un ensemble de machines. De plus, les utilitaires de compression de modèles appliqués pendant le temps d’inférence permettent à chaque tâche d’être exécutée avec une certaine compression, ce qui présente un compromis entre son niveau de compression (et son temps de traitement) et son utilité obtenue. L’objectif est de maximiser l’utilité de la tâche. Nous proposons donc des algorithmes d’approximation avec des garanties éprouvées pour résoudre le problème et étendre le modèle afin d’intégrer les contraintes budgétaires énergétiques. 
Nous avons ensuite étudié les impacts environnementaux croissants associés à l’utilisation de l’IA. Récemment, de nouveaux paradigmes en matière d’IA verte ont émergé, passant du principe « plus c’est gros, mieux c’est », qui privilégie les grands modèles, à celui « petit suffit », qui met l’accent sur la sobriété énergétique grâce à des modèles plus petits et plus efficaces. Nous étudions comment la communauté de l’IA peut adopter la sobriété énergétique aujourd’hui en se concentrant sur la sélection des modèles pendant l’inférence. Nous avons estimé les économies d’énergie réalisées en sélectionnant le modèle pour exécuter les demandes d’inférence. Enfin, afin d’analyser de manière globale les implications environnementales de l’IA, nous avons réalisé une analyse du cycle de vie (ACV) de Pl@ntNet, une application basée sur l’IA. Celle-ci comprend une évaluation multicritères et multi-étapes afin d’obtenir une image complète de son empreinte écologique.