Estimation statistique en contexte géométrique
Au cours des dernières années, l’essor des données de grande dimension a placé les statistiques et le machine learning face à un défi central : le fléau de la dimension. Une approche particulièrement féconde pour y faire face consiste à adopter un point de vue géométrique, en exploitant les corrélations internes aux données afin d’en révéler une structure sous-jacente de dimension réduite. Cette idée, formalisée par l’hypothèse de la variété, revient à considérer que les données sont contraintes par une géométrie implicite, sur laquelle il est possible de projeter les méthodes d’estimation.
Cette perspective pose alors la question fondamentale de développer une théorie de l’estimation statistique en contexte géométrique. Dans cet exposé, je discuterai de ces questions à travers les liens entre la géométrie d'un espace et les propriétés statistiques des barycentres.