Retour

Fondements du Machine Learning

ECTS : 3

Description du contenu de l'enseignement :

Dans ce cours, on s’intéresse à des techniques visant à extraire de l’information d’un jeu de données via l’obtention de modèles linéaires des relations entre les données. Ce choix se justifie par la pertinence et l’efficacité de ces modèles simples dans la pratique. On considèrera que l'on dispose de données pour lesquelles cette extraction d'information est pertinente. A cette fin, les données seront généralement pensées comme des réalisations de variables aléatoires. On présentera ainsi un ensemble de résultats et d'algorithmes mêlant des éléments d'algèbre linéaire, d’optimisation et de statistiques. 

Durant le cours, on abordera la décomposition en valeurs singulières en tant qu'outil fondamental, ainsi que son utilisation dans les moindres carrés linéaires et l'analyse en composantes principales. On se penchera longuement sur les modèles de régression linéaires, et leur interprétation via les moindres carrés et l'estimation statistique. On illustrera enfin les résultats théoriques via des applications caractéristiques de l'analyse de données.

Compétence à acquérir :

Connaître et manipuler les techniques d'analyse de données liées à des modèles linéaires.

Bibliographie, lectures recommandées :

S. Boyd and L. Vandenberghe. Introduction to Applied Linear Algebra - Vectors, Matrices and
Least Squares
. Cambridge University Press, 2018.
G. Strang, Linear algebra and learning from data. Wellesley-Cambridge Press, 2019.

Université Paris Dauphine - PSL - Place du Maréchal de Lattre de Tassigny - 75775 PARIS Cedex 16 - 06/07/2024