Retour
Année universitaire 2025/2026

Ingénierie Statistique et Financière - 2e année de Master en alternance

Responsable pédagogique : PIERRE BRUGIERE - https://sites.google.com/view/pierrebrugiere/home

Crédits ECTS : 60

Les objectifs de la formation

La 2e année du Master Mathématiques et Applications parcours Ingénierie Statistique et Financière par la voie classique (ISF classique) prépare à des emplois de niveau BAC+5 nécessitant l'utilisation des mathématiques appliquées en lien avec les besoins des entreprises en statistique et en finance. Il offre aux étudiants une formation solide leur permettant une insertion professionnelle rapide dans les métiers de l'industrie et des services. Le master offre deux voies : voie "Science des Données" et voie "Finance". L'accent est mis sur la formation professionnelle avec le concours de particiens issus du monde de l'entreprise, et sur la connaissance de l'entreprise par l'intermédiaire de stages.

Cette formation a pour objectifs de former des cadres d'entreprise.

Modalités d'enseignement

Les Modalités des Contrôles de Connaissances (MCC) détaillées sont communiquées en début d'année. Les enseignements de la deuxième année de Master mention Mathématiques et Applications pour le parcours ISF en apprentissage sont organisés en semestres 3 et 4. Le semestre 3 est constitué d'UE fondamentales et le semestre 4 est constitué d'UE fondamentales et d'UE complémentaires voie "Quantification des Risques Financiers (QRF)" ou voie "Modélisation et Big Data (MBD)" auquel s'ajoute une note bloc "Conduite de projet et mémoire". La formation démarre en septembre. Le rythme d'alternance est de 3 jours en entreprise et 2 jours à l'université.

Admissions

Peuvent postuler les étudiantes et étudiants titulaires :

Les admissions sont décidées par une Commission Pédagogique d'Admission composée d'enseignants de l'Université Paris Dauphine - PSL et de personnalités extérieures. L'examen des dossiers peut inclure des entretiens oraux avec les candidats. Les étudiantes et les étudiants souhaitant s'inscrire dans le master doivent déposer un dossier de candidature avant la date limite fixée par le département MIDO. Les prérequis : Le niveau recommandé est celui d'une première année de master de mathématiques appliquées avec une formation de base en statistique (analyse des données, inférence statistique, modèle linéaire), et en informatique (usage courant d'un PC, bureautique, programmation, logiciels type SAS, R, Python, etc., connaissance élémentaire des bases de données relationnelles). Des connaissances de base en finance sont demandées pour la voie « finance » (mathématiques financières, notions de finance d'entreprise et de marché, théorie du portefeuille, produits dérivés). Le niveau recommandé en probabilités et statistique est celui d'ouvrages comme : Le niveau recommandé pour la voie finance est celui d'ouvrages comme : La Commission Pédagogique d'Admission peut admettre des candidats dont les dossiers ne satisfont pas aux conditions de prérequis. Dans ce cas, les admis ont l'obligation de suivre et valider des enseignements précisés par la Commission, en troisième année de licence MIDO ou en première année de Master MIDO de l'Université Paris Dauphine - PSL.

Poursuite d'études

Plus de 80% des étudiantes et des étudiants rejoignent des banques, sociétés d'assurance, conseil ou services financiers, tandis que le autres font le choix d'un VIE ou plus rarement d'une formation complémentaire.

Les métiers ciblés par cette formation sont :

Programme de la formation

Description de chaque enseignement

Semestre 3 - 30 ECTS (voie MDB) ou 34 ECTS (voie QRF)

UE fondamentales

Anglais des affaires

ECTS : 2

Enseignant responsable : CATHERINE PIOLA (https://dauphine.psl.eu/recherche/cvtheque/piola-catherine)

Langue du cours : Anglais

Volume horaire : 18

Description du contenu de l'enseignement :

1. Présentation des concepts et outils utilisés en management de projet, illustrée par des exemples concrets portant sur des projets, notamment dans le domaine de la Data Science.
2. Réalisation en groupe d’un projet de communication.

Compétences à acquérir :

Amener les étudiants à développer des stratégies qui leur permettent d’améliorer leurs compétences langagières, à l’écrit comme à l’oral. Un contenu lié à la recherche d’emploi et au monde du travail est abordé au moyen de simulations et d’exercices de compréhension, de production et d’écoute.


Decentralized & Crypto Finance : new era of financial services

ECTS : 2

Enseignant responsable : REMY OZCAN

Langue du cours : Anglais

Volume horaire : 15


Deep learning

ECTS : 2

Enseignant responsable : GABRIEL TURINICI (https://turinici.com)

Langue du cours : Anglais

Volume horaire : 18

Description du contenu de l'enseignement :

 1/ Deep learning: major applications, key references, general background
2/ Types of approaches: supervised, reinforcement, unsupervised
3/ Neural networks: presentation of the main components—neurons, operations, loss function, optimization, architecture
4/ Focus on stochastic optimization algorithms, convergence proof of SGD
5/ Convolutional neural networks (CNNs): filters, layers, architectures
6/ Techniques: backpropagation, regularization, hyperparameters
7/ Networks for sequences: RNN, LSTM, Attention, Transformer
8/ Generative networks (GAN, VAE)
9/ Programming environments for neural networks: TensorFlow, Keras, PyTorch, and hands-on work with the examples covered in class
10/ Stable Diffusion, LLMs
11/ Ethical and alignment perspectives 

Compétences à acquérir :

introduction to deep learning

Pré-requis obligatoires

python, mathematics: algebra, probabilities, numerical analysis

Bibliographie, lectures recommandées :

https://turinici.com

En savoir plus sur le cours : https://turinici.com


Introduction à l'apprentissage supervisé

ECTS : 3

Enseignant responsable : PATRICE BERTRAND (https://dauphine.psl.eu/recherche/cvtheque/bertrand-patrice)

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

1- Analyse factorielle discriminante 2- Analyse discriminante linéaire et quadratique 3- Classification bayésienne à l'aide de modèles génératifs de mélange 4- Classifieur bayésien et classifieur bayésien naïf 5- Sélection de modèles de mélange parcimonieux 6- Arbres de décision 7- Forêts aléatoires L'ensemble de ces méthodes enseignées est illustré par des démonstrations du logiciel R sur des jeux de données réel (principalement  Analyse Discriminante linéaire et quadratique, Classification bayésienne gaussienne, Classifieur bayésien naïf, Forêts aléatoires).

Compétences à acquérir :

Ce cours présente les méthodes élémentaires d'apprentissage supervisé suivantes : analyse factorielle discriminante, classification bayésienne à l'aide de modèles génératifs de mélange, arbres de décision et forêts aléatoires. Les propriétés théoriques et différentes formulations de ces méthodes sont présentées. Leurs mises en oeuvre, ainsi que celles de leurs variantes, sont illustrées à l'aide de traitements de données effectués avec le logiciel R. L'objectif de ce cours est l'acquisition de la maîtrise de ces méthodes élémentaires d'apprentissage supervisé.

Pré-requis obligatoires


Algèbre Linéaire (calcul matriciel), Analyse Factorielle (cadre général et cas de l'Analyse en Composantes Principales), Théorie élémentaire des probabilités

 

Bibliographie, lectures recommandées :

- Benzecri, J.-P. (1980) Pratique de l'analyse des données. Dunod. Paris. - Bouveyron, C., Celeux, G., Murphy, T., & Raftery, A. (2019) Model-Based Clustering and Classification for Data Science: With Applications in R, Cambridge Series in Statistical and Probabilistic Mathematics, Cambridge: Cambridge University Press. - Breiman,L., Friedman, J.H., Olshen,R., and Stone, C.J. (1984). Classification and Regression Trees, Wadsworth & Brooks/Cole Advanced Books & Software, Pacific California. - Hastie, T., Tibshirani, R., Friedman, J. (2009) The Elements of Statistical Learning : Data Mining, Inference, and Prediction, Second Edition, Springer Series in Statistics. - James, G., Witten, D., Hastie, T., Tibshirani, R., Taylor, J., (2023) An Introduction to Statistical Learning: With Applications in Python, Springer International Publishing. - Lebart, L., Piron, M. , Morineau, A. (2006) (4ème edition, refondue) Statistique Exploratoire Multidimensionnelle, 480 pages, Dunod. - Saporta, G. (2006), Probabilités, Analyse des données et Statistique, 656 pages, Technip.

En savoir plus sur le cours : Examen


Introduction à l'assurance vie et non vie

ECTS : 2

Enseignant responsable : MICHEL GERMAIN

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

1. Définir les termes et les acteurs d’une opération d’assurance
2. Donner des éléments statistiques sur le secteur de l’assurance
3. Rappeler des éléments de probabilité et de mathématiques financières
4. Déterminer la tarification des engagements vie et non vie
5. Exposer les formes de garanties proposées en vie et en non vie
6. Calculer les engagements techniques des contrats d'assurance
7. Étudier la gestion du risque au niveau de l’organisme assureur
8. Donner des notions de comptabilité et de réglementation propre à l'assurance
9. Présenter les principes de la réassurance
10. Étudier la notion de solvabilité d’un organisme assureur et quelques éléments prudentiels

Compétences à acquérir :

Présenter les principaux modèles de l’assurance vie et non vie.


Introduction au Machine learning

ECTS : 2

Enseignant responsable : PIERRE BRUGIERE (https://sites.google.com/view/pierrebrugiere/home)

Langue du cours : Français

Volume horaire : 18

Description du contenu de l'enseignement :

1. Supervised and unsupervised learning 2. Calibration versus prediction: how to avoid over-fitting 3. Measure of the complexity of a model according to Vapnik-Chervonenkis 4. Vapnik-Chervonenkis's inequality and the control of the prediction error 5. Maximum margin SVMs and Gap tolerant classifiers 6. C-SVMs and duality 7. SVMs with kernels and Mercer's theorem 8. The simplex case  9. Mu-SVM, duality and reduced convex envelopes   10. Single class SVMs, anomaly detections and clustering 11. An introduction to Bootstrap, decision trees and random forests 12. Ridge Regression, penalization, and yield curve smoothing 13. The Representer theorem, Lasso, parsimony and duality.

Compétences à acquérir :

Théorie du statistical learning. Comprendre comment utiliser les Supports Vectors Machines pour l'apprentissage supervisé et non supervisé. Quelques application des méthodes de regressions pénalisées. Application à des problèmes de crédit et de courbe des taux.

Pré-requis obligatoires

Algèbre linéaire et calcul différentiel

Pré-requis recommandés

Algèbre linéaire, calcul différentiel et optimisation au niveau M1

Mode de contrôle des connaissances :

Examen

Bibliographie, lectures recommandées :

[1] Pierre Brugiere: https://hal.archives-ouvertes.fr/cel-01390383v2  [2] Wolfgang Karl Härdle, Rouslan Moro, Linda Hoffmann : Learning Machines Supporting Bankruptcy Prediction, SFB 649 Discussion Paper 2010-032  [3] Dave DeBarr and Harry Wechsle: Fraud Detection Using Reputation Features SVMs, and Random Forests   [4] Trevor Hastie, Robert Tibshirani, Jerome Friedman: The Elements of Statistical Learning  [5] Christopher Bishop: Pattern Recognition and Machine Learning [6] Andriy Burkov: The Hundred-Page Machine Learning Book


Méthodes actuarielles

ECTS : 3

Enseignant responsable : MARC DOMANGE

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

1. Instruments et marchés (marchés monétaires, marchés obligataires) 2. Mesure et couverture du risque de taux (duration, convexité, ACP) 3. Reconstitution de la structure par terme des taux (modèles à splines, modèles paramétriques) 4. Théories de la structure par terme des taux (anticipations pures, prime de risque pure, segmentation, anticipations biaisées) 5. Gestion passive (tracking error, échantillonnage stratifié) 6. Gestion active (roll-down, barbell, bullet, butterfly) 7. Produits dérivés de taux (futures & swaps)

Compétences à acquérir :

Fournir une explication détaillée de la structure par terme des taux et apporter un éclairage sur les différentes stratégies de gestion et leur mise en œuvre.


Méthodes pour les modèles de régression

ECTS : 3

Enseignant responsable : PATRICE BERTRAND (https://dauphine.psl.eu/recherche/cvtheque/bertrand-patrice)

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

L'objectif de ce cours est de présenter aux étudiants des connaissances fondamentales, sur la régression d'un point de vue théorique ainsi que sur le code lié à ce domaine. 

  • Rappels sur les projections dans un espace vectoriel. Projections dans l'espace L2 des variables aléatoires de carré intégrable. Cas multi-varié.
  • Présentation de la régression linéaire avec des hypothèses minimales. Risques empirique et de généralisation. Théorème de Frisch-Waugh-Lovell. Coefficients de détermination centré et non centré.
  •  Propriétés statistiques des estimations MCO (Moindres Carrés Ordinaires) avec les hypothèses standard de normalité : tests sur les coefficients, théorème de Gauss-Markov. Cas où les hypothèses standard ne sont pas vérifiées : estimateur des moindres carrés généralisé, biais endogène, variables instrumentales.
  • Régularisation et sélection de modèles : régressions Ridge et Lasso, régression bayésienne et estimateur de la régression Ridge, validation croisée, critères de validation (AIC, BIC, Cp-Mallows,...).
  • Analyse de différents modèles linéaires gaussiens multivariées sous R ou Python à partir de jeux de données réelles.

Compétences à acquérir :

A la suite de ce module, les étudiants seront capables de comprendre la régression d'un point de vue théorique et de coder les différentes procédures étudiées. Ils auront le recul nécessaire pour préselectionner des procédures adaptées à la spécifité du jeu de données et sélectionner celles ayant les meilleures performances de généralisation.

Pré-requis obligatoires

Notions de base en Algèbre linéaire, Probabilité et Statistiques

Mode de contrôle des connaissances :

Examen


Méthodologie en gestion globale des Risques : VaR

ECTS : 3

Enseignant responsable : DENIS BERTIN

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

1. Introduction et définition de la Value at Risk 2. Méthodes et méthodologies de calcul 3. Choix de distribution de probabilité pour positions optionnelles 4. Mesure de risque de marché et RiskMetrics 5. Risque de crédit et exigences réglementaires 6. Risque de corrélation défavorable, liquidité et xVA 7. Expected Shortfall et VaR sur Valeurs extrêmes

Compétences à acquérir :

Clarifier la notion de risque et présenter les principales techniques et méthodes de VaR permettant de mesurer, analyser et prédire le risque.
Le risque de marché fera l’objet d’’une attention particulière au travers de l’analyse de la VaR. Les méthodes de gestion globale du risque de marché lorsque les sources d’incertitudes sont multiples seront également étudiées.


Processus Stochastiques

ECTS : 3

Enseignant responsable : EMMANUEL LEPINETTE (https://sites.google.com/view/emmanuel-lepinette/research-cv-and-others)

Langue du cours : Français

Volume horaire : 30

Description du contenu de l'enseignement :

1. Processus stochastiques, processus à variations finies. 2 Intégrale stochastique, processus d'Ito, calcul stochastique.
3. EDS; exemples en finance.

Compétences à acquérir :

Approfondir les notions de processus stochastiques, équations différentielles stochastiques  (EDS) , lien avec les équations aux dérivées partielles (e.d.p) et applications à la finance

Pré-requis obligatoires

Calcul de probabilités (bases de la théorie de la mesure, notion d'espérance conditionnelle, modes de convergence des variables aléatoires, filtration, martingales)

Pré-requis recommandés

Processus stochastiques en temps discret, martingales.

Mode de contrôle des connaissances :

CC(30%) + Examen(70%)


SAS, R et Python

ECTS : 3

Enseignants : LAURENT ALLO, GREGOIRE DE LASSENCE

Langue du cours : Français

Volume horaire : 24

Description du contenu de l'enseignement :

  • Les bases de la data (les formats des fichiers, la BI ...)
  • Les environnements de données (Big Data, Distribué ...) 
  • Les étapes de la Data Analyse 
  • WebScraping et API (Beautiful Soup)
  • Data Manipulation et Analyse avec Pandas et Polars
  • Versioning du code et hébergement du code (Git et Github)
  • Data Visualisation Théorique & Pratique (Seaborn)
  • Introduction à l'IA et script python

Compétences à acquérir :

  • Etre à l'aise avec les environnements de données 
  • Savoir utiliser le bon outil en fonction du besoin
  • Savoir travaillé à plusieurs sur un projet Data
  • Avoir une bonne vision de la donnée en entreprise

Pré-requis obligatoires

Python

Mode de contrôle des connaissances :

Projet en groupe + QCM


Solvabilité II

ECTS : 2

Enseignant responsable : LOUIS-ANSELME DE LAMAZE

Langue du cours : Français

Volume horaire : 18

Description du contenu de l'enseignement :

1. Introduction au contexte de solvabilité 2. Présentation du calcul de solvabilité 3. Dispositifs de gestion des risques (ORSA) 4. Analyse prospective & introduction à l’appétence aux risques

Compétences à acquérir :

Fournir aux étudiants des connaissances sur le contrôle prudentiel des organismes d’assurances. Leur permettra d’appréhender la complexité des problèmes comptables et les mécanismes d’évaluation du ratio de solvabilité. Le fonctionnement et l’approche de la gestion des risques dans le secteur de l’assurance seront présentés dans ce nouveau contexte.


UE complémentaires voie QRF

Modélisation stochastique du risque de crédit

ECTS : 2

Enseignant responsable : EMMANUEL LEPINETTE (https://sites.google.com/view/emmanuel-lepinette/research-cv-and-others)

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

Le modèle de Merton, les modèles à intensité.

Compétences à acquérir :

Comprendre et savoir implémenter en Python, les principaux modèles de la littérature.

Pré-requis obligatoires

Calcul stochastique + théorie des probabilités+ Python.

Pré-requis recommandés

Calcul stochastique + théorie des probabilités+ Python.

Mode de contrôle des connaissances :

CC (30%) + Examen final (70%)

Bibliographie, lectures recommandées :

Cours auto-suffisant.


Statistiques et dynamique des produits dérivés

ECTS : 2

Enseignant responsable : GABRIEL TURINICI (https://turinici.com)

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

 1/ Approches en probabilité historique (gestion de portefeuille classique), portefeuilles optimaux, beta, arbitrage, APT

2/ Valuation de produits dérivés et probabilité risque neutre

3/ Delta hedging en pratique, trading de volatilité

4/ Assurance du portefeuille: stop-loss, CPPI, CRP - Constant Mix, Buy & Hold

5/ Options exotiques ou cachées: ETF short,

6/ Si le temps permet: approches machine learning en gestion dynamique du portefeuille

Compétences à acquérir :

approche pratique et empirique (programmation Python) de la gestion de portefeuille, des produits dérivés et de la gestion de risques tout en se basant sur une formalisation stochastique avancée

Pré-requis obligatoires

algèbre niveau L2-L3

Pré-requis recommandés

python, calcul stochastique, produits dérivés

Mode de contrôle des connaissances :

voir CC

Bibliographie, lectures recommandées :

Voir https://turinici.com

En savoir plus sur le cours : https://turinici.com


Semestre 4 - 11 ECTS (voie MDB) ou 15 ECTS (voie QRF)

UE fondamentales

Culture Financière et pratique de Bloomberg

ECTS : 2

Enseignants : DENIS BERTIN, PIERRE BRUGIERE
https://sites.google.com/view/pierrebrugiere/home

Langue du cours : Français

Volume horaire : 15

Description du contenu de l'enseignement :

1. Le bilan d’une entreprise et les différentes catégories de titres
2. Les actions, la dette, la dette hybride, le Tier 1, le Tier 2, le Tier 3
3. Les obligations convertibles, les mandatory convertibles
4. Les opérations en capital, les augmentations de capital, les FRESHs les Cocos
5. Les rachats d’actions, simples ou structurés
6. Les dividendes cash ou scrip, formules d’ajustements des dérivés
7. Les activités ECM, DCM, EQL, M&A
8. Séances pratiques sur Bloomberg :
· construction de tableaux de bords en temps réel (BDP)
· analyses historiques (BDH)
· analyse financière
· spreadsheets et templates Bloomberg

9. Mini projet de gestion de portefeuille

Compétences à acquérir :

Connaitre les principales notions de corporate finance, analyser des données financières sur Bloomberg, faire un mini projet en gestion de portefeuille


Pratique des options

ECTS : 2

Enseignant responsable : BERTRAND FAUCHER

Langue du cours : Français

Volume horaire : 18

Description du contenu de l'enseignement :

1. Mise en situation concrète du métier de trading (market making)
2. Pricing des options complexes à partir de celui des options vanilles
3. Les risques dans la vraie vie
4. Au-delà des grecques

Compétences à acquérir :

- Comprendre les responsabilités d’un market maker d’options
- Maîtriser les implications concrètes au-delà des équations de la gestion d’un portefeuille d’options
- Acquérir des réflexes afin de repérer rapidement les principales sources de risques


Python et pratique de la Data Science

ECTS : 2

Enseignant responsable : Pierre FIHEY

Langue du cours : Français

Volume horaire : 18

Description du contenu de l'enseignement :

  • Préparation des données, EDA. Traitement des classes déséquilibrées
  • Scrapping de données
  • Apprentissage non supervisé (Clustering, Réduction de dimensions)
  • Apprentissage supervisé (Classification, Régression)
  • Deep Learning (ANN, RNN, LSTM)
  • Natural Language Processing (De Bag Of Words aux Transformers)

    L'objectif de ce cours est de rappeler la théorie derrière les principaux algorithmes de ML, Deep Learning et NLP avant de mettre en pratique l'ensemble de ces algorithmes dans un projet appliqué à la prédictions de mouvements de stocks financiers.

Compétences à acquérir :

Connaissances des principaux algorithmes de Machine Learning, Deep Learning et Natural Language Processing.
Savoir implémenter ces méthodes et comparer leurs performances.
Projet combinant l'ensemble de ces méthodes, appliqué à la finance.  

Mode de contrôle des connaissances :

Projet (Code + Rapport)


UE complémentaires voie QRF

Implémentation de modèles multivariés en finance et assurance

ECTS : 2

Enseignant responsable : EMMANUEL LEPINETTE (https://sites.google.com/view/emmanuel-lepinette/research-cv-and-others)

Langue du cours : Français

Volume horaire : 18

Description du contenu de l'enseignement :

La dépendance à travers les copules, applications dans divers problèmes, mesures de risques dans des problèmes multivariés, problème de sur-réplication dans des problèmes multivariés. Divers exemples d'implémentations numériques multi-dimensions.

Compétences à acquérir :

Savoir modéliser un problème issu de la finance ou de l'assurance, savoir le résoudre er l'implementer en Python.

Pré-requis obligatoires

Cours de calcul stochastique, de bonnes bases en théorie des probabilités, des notions en algorithmique et Python.

Pré-requis recommandés

Cours de calcul stochastique, de bonnes bases en théorie des probabilités, des notions en algorithmique et Python.

Mode de contrôle des connaissances :

CC (30%)+examen final (70%)

Bibliographie, lectures recommandées :

Le cours est auto-suffisant. 


Modélisation stochastique de la courbes de taux

ECTS : 3

Enseignant responsable : IMEN BEN TAHAR (https://dauphine.psl.eu/recherche/cvtheque/ben-tahar-imen)

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

1. Quelques outils de calcul stochastique : rappels 2. Généralités sur les taux d'intérêt 3. Produits de taux classiques 4. Modèle LGM à un facteur 5. Modèle BGM (Brace, Gatarek et Musiela) / Jamishidian 6. Modèles à volatilité stochastique

Compétences à acquérir :

Ce cours est consacré aux modèles de taux d’intérêts à temps continu. Au travers de nombreux exemples, on décrira leurs utilisations pour évaluer les produits dérivés sur taux d’intérêt.


UE complémentaires voie MDB

Data Science pour le Business

ECTS : 2

Enseignants : PIERRE FISZ, BASSEM GHARBI, BAN ZHENG
https://dauphine.psl.eu/recherche/cvtheque/fisz-pierre
https://dauphine.psl.eu/recherche/cvtheque/zheng-ban

Langue du cours : Français

Volume horaire : 21


Machine Learning, Transformer et NLP

ECTS : 2

Enseignant responsable : DIDIER JEANNEL

Langue du cours : Français

Volume horaire : 18

Description du contenu de l'enseignement :

1. Introduction au Traitement Automatique du Langage Naturel (NLP)

  • Définition et enjeux du NLP
  • Applications du NLP dans l'industrie et la recherche
  • Évolution des approches NLP : des modèles classiques aux Transformers
2. Modélisation des Textes
  • Représentation des textes : Bag of Words, TF-IDF
  • Limites des représentations classiques
  • Introduction aux Word Embeddings
3. Pré-traitement du Texte
  • Tokenization : règles et techniques
  • Utilisation des expressions régulières (REGEX) pour le nettoyage      des textes
  • Stemming et lemmatisation : différences et usages
  • Suppression des stopwords et normalisation des textes
4. Techniques de Word Embeddings
  • Introduction aux embeddings contextuels et statiques
  • Présentation des modèles GloVe et Word2Vec
  • Comparaison et utilisation des embeddings dans le NLP
5. Sentiment Analysis
  • Utilisation des lexiques de sentiments
  • Visualisation des sentiments avec des graphiques
  • Approches non supervisées pour l'analyse des sentiments
  • Classification Naïve Bayes appliquée à l'analyse de sentiments
6. Introduction aux Transformers
  • Architecture des Transformers : concepts clés
  • Attention et auto-attention : mécanismes et visualisation
  • Applications générales des Transformers (traduction, résumé,      génération de texte)
  • Présentation de l'environnement Hugging Face
7. Utilisation des Transformers
  • Panorama des modèles de Transformers : BERT, GPT, T5, etc.
  • Visualisation des mécanismes d'attention
  • Entraînement et fine-tuning d'un Transformer
  • Pipelines NLP avec Hugging Face : classification, résumé,      traduction
8. Application aux Résumés de Texte
  • Types de résumé automatique : extractif vs. abstractive
  • Comparaison des modèles de résumé
  • Métriques d'évaluation : ROUGE, BLEU, METEOR
  • Implémentation pratique d'un modèle de résumé avec Transformers
9. Projet Final et Évaluation
  • Mise en œuvre d'un projet appliqué utilisant les Transformers
  • Présentation des résultats et discussion
  • Évaluation finale du cours
Evaluation
  • Examen en salle informatique (100%)

Compétences à acquérir :

Comprendre des NLPs et les Transformers

Mode de contrôle des connaissances :

Examen en salle informatique 100%


Recent Advances in Data Sciences

ECTS : 3

Enseignant responsable : THEO LOPES QUINTAS (https://github.com/theo-lq/Recent-Advances-in-ML)

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

Le domaine du Machine Learning et du Deep Learning évoluant sans cesse plus rapidement, il est essentiel d'avoir des bases solides dans ces deux domaines pour naviguer dans les nombreux articles de recherche du domaine. Nous traiterons de notions réinterprétés ou présentés entre 2017 et 2023 à la lumière d'articles plus anciens.

Les séances serons organisée par thème :

  1. Bon départ d'un réseau de neurones
  2. Calibration en Machine Learning
  3. Mise à jour moderne des poids d'un réseau de neurones
  4. Avancées des Large Language Models pour les réseaux de neurones en général
  5. Tokenization et impacts

Pour chaque séances plusieurs TP avec PyTorch serons proposés pour manipuler le cours. Les séances restante seront dédiés à la préparation d'une soutenance finale portant sur une ou plusieurs des notions abordées dans les 5 séances.

Compétences à acquérir :

  • Lecture, implémentation et critique d'un papier de recherche en Machine Learning
  • Utilisation de PyTorch et Latex
  • Capacité de synthèse et de vulgarisation de notions complexe en Machine Learning
  • Culture générale sur le domaines et les acteurs

Pré-requis obligatoires

Machine Learning et Deep Learning, mathématiques niveau master 1 maths

Mode de contrôle des connaissances :

Soutenance d'un sujet de recherche proposé, avec rédaction d'un rapide compte-rendu, des slides et un notebook.

Bibliographie, lectures recommandées :

  • Machine Learning et Deep Learning
    • Hands-on Machine Learning with Scikit-Learn, Aurélien Géron, O'Reilly
    • Deep Learning avec TensorFlow, Aurélien Géron, O'Reilly
    • Deep Learning with Python, François Chollet, Manning
  • Culture générale
    • Weapons of Math Destruction, Cathy O'Neil, Crown Books
    • Quand la machine apprend, Yann Le Cun, Odile Jacob
    • De l'autre côté de la machine: Voyage d'une scientifique au pays des algorithmes, Aurélie Jean, Édition de l'observatoire


Renforcement Learning

ECTS : 2

Enseignant responsable : GABRIEL TURINICI (https://turinici.com)

Langue du cours : Français

Volume horaire : 21

Description du contenu de l'enseignement :

 1/ Introduction to reinforcement learning
2/ Theoretical formalism: Markov Decision Processes (MDPs), value function (Bellman equation and Hamilton–Jacobi–Bellman equation), etc.
3/ Common strategies illustrated with the “multi-armed bandit” example
4/ Deep learning strategies: Q-learning, DQN
5/ Deep learning strategies: SARSA and variants
6/ Deep learning strategies: Actor–Critic and variants
7/ Various Python implementations
8/ Ethical perspectives, the alignment problem, recent approaches and applications 

Compétences à acquérir :

Introduction to reinforcement learning and deep reinforcement learning,  with an empirical machine learning perspective: main algorithms, practical implementations (gymnasium) 

Pré-requis obligatoires

python, numérical analysis

Pré-requis recommandés

tensorflow, keras, pytorch

Bibliographie, lectures recommandées :

https://turinici.com

En savoir plus sur le cours : https://turinici.com


Conduite de projets et mémoire - 15 ECTS

Conduite de projet et Mémoire

ECTS : 15

Enseignants : PIERRE BRUGIERE, OLIVIER SOUSSAN
https://sites.google.com/view/pierrebrugiere/home

Langue du cours : Français

Description du contenu de l'enseignement :

1. Présentation des concepts et outils utilisés en management de projet, illustrée par des exemples concrets portant sur des projets, notamment dans le domaine de la Data Science.
2. Réaliser en groupe un projet de communication (maintien du site web, présence sur les réseaux sociaux, brochure du master, participation à des forums)
3. Exposer en public son mémoire d’apprentissage

Compétences à acquérir :

Familiariser les étudiants aux méthodes de communication dans le cadre d’un projet concret et leur apprendre les bases de la communication en entreprise (oral et écrit). Suivre le mémoire d’apprentissage

Mode de contrôle des connaissances :

 Controle continu + mémoire en fin d'année


Document susceptible de mise à jour - 01/04/2026
Université Paris Dauphine - PSL - Place du Maréchal de Lattre de Tassigny - 75775 PARIS Cedex 16