Projets

Les propositions de projets de M1. Vous devrez faire votre choix (en contactant directement les encadrants) pour le 26 Janvier.
Attention les projets s'affichent sur plusieurs pages!

Par Nicolas Maudet , 6 janvier, 2024

Le problème d'agrégation d'ordres de préférences est très commun et utile dans de nombreux domaines. La méthode de Kemeny (qui minimise les désaccors sur les paires mal rangées) est une des approches les plus classiques, mais elle est difficile à calculer. Plusieurs méthodes sont connues pour donner des approximations du classement de Kemeny (par exemple la règle de Borda, la règle de Spearman).

Par Nicolas Maudet , 6 janvier, 2024

Le jeu l'ile interdite est un jeu coopératif relativement simple (https://boardgamegeek.com/boardgame/65244/forbidden-island) qui demande à une équipe de joueurs de collaborer pour récupérer des trésors et s'échapper d'une ile sous la menace de la montée des eaux. Il peut se jouer de 2 à 4 joueurs. L'objectif de ce projet est :
* de proposer une interface permettant de jouer entre joueurs humains

Par Olivier Sigaud , 6 janvier, 2024

Les foundational models, d’énormes réseaux de neurones entraînés sur des bases de données gigantesques, promettent d’améliorer très significativement la capacité de l’IA à résoudre des problèmes très variés comme la compréhension du langage naturel ou la commande de robots pour accomplir des tâches indiquées verbalement. Un certain nombre de ces modèles déjà entraînés sont disponibles en open source et ne demandent qu’à être testés, comme Octo et Voltron.

Par Olivier Sigaud , 6 janvier, 2024

Augmented Random Search (ARS) est un algorithme de type évolutionnaire très simple qui s’avère très performant pour optimiser une politique. Par ailleurs, BBRL est une librairie développée par l’encadrant destinée à faciliter le codage d’algorithmes d’apprentissage par renforcement.

L’objectif de ce projet est de développer ARS au sein de la librairie BBRL, puis de comparer sa performance à celle d’autres algorithmes disponibles comme la cross-entropy method (CEM) ou divers algorithmes d’apprentissage par renforcement.

Par Olivier Sigaud , 2 janvier, 2024

L’algorithme Temporal Difference Model Predictive Control (TD-MPC) propose des avancées intéressantes vis-à-vis de l’état de l’art en apprentissage par renforcement. Il s’agit d’un algorithme Model-based, ce qui lui permet d’apprendre avec peu d’échantillons d’apprentissage, et il combine les méthodes de différences temporelles de l’apprentissage par renforcement et des méthodes de recherche de séquence optimales d’action, ce qui le rend très performant.

Par Cedric Herpson , 12 janvier, 2023

Collaboration avec le service de mobilité internationale de la faculté des sciences de Sorbonne-Université.
L'objectif est de proposer un algorithme d’appariement entre les candidatures d’environ 200 étudiants à la mobilité internationale et environ 40 établissements cibles afin de diviser par au moins 2 le temps de travail actuellement nécessaire pour trouver un appariement satisfaisant.

Par Julien Gori , 10 janvier, 2023

On doit parfois prendre des décisions à partir de données incomplètes. Pour ce projet, on considère un contexte où une personne doit prendre une décision et est assistée par un/des algorithmes qui peuvent proposer des suggestions à plusieurs niveaux.