Encadrement
Doctorants
- Co-encadrement (avec Raphael Paris) d'Emmie Bonnilauri : pré-doctorat en 2021/2022 et doctorat a partir de sept. 2022. Il s'agit d'un co-encadrement avec les géologues sur l'analyse des risques de tsunami sur des iles volcaniques.
- Membre du Jury de la thèse de Clément Berenfeld.
- Parrainage de Damien Rivet (2017/2022).
- Parrainage de Clément Legrand (2022..).
Stages de Césure
Bienvenu a Axel Mothe, que nous venons d'accueillir avec Anne Françoise Yao pour un stage de césure 6 mois.
Stages de Master : conseils pour la rédaction des rapports.
A chaque encadrement de stage de master, je suis confrontée à la question "qu'attendez vous pour le rapport de stage ?". Ceci est une compilation des différentes réponses/conseils que j'ai donné aux étudiants.
La rédaction est un exercice difficile. Le meilleur conseil qu'on m'ait donné est d'"
essayer de se mettre à la place du lecteur".
Vous allez avoir plusieurs lecteurs avec des attentes différentes.
- Des enseignants : Ont plusieurs rapports à lire, veulent un rapport court, synthétique, scientifique. Ils vont avoir des tas de rapports à lire ils veulent que vous alliez droit au but !
- Des collègues de l'entreprise : Ils n'auront que votre rapport à lire et veulent des détails, des points téchniques afin de pouvoir reproduire/réutiliser votre travail.
- Le rapport principal : sera destiné à tous (enseignants/collègues), il sera synthétique (30-40 pages sont souvent parfaitement suffisantes)
- Les annexes : destinées à vos collègues, elles contiendront l'ensemble des résultats et méthodes employées mais ne nécessiteront pas forcément une redaction (litéraire) soignée.
- Integration/Encadrement : Une petite introduction présentant la structure dans laquel vous avez fait votre stage nous montre votre niveau d'intégration, c'est pourquoi, dans cette partie, j'attend aussi vos impressions personnelles et pas seulement un copier/coller du site de l'entreprise. Il est aussi important pour nous, en tant qu'enseignants de savoir si vous etiez le seul statisticien, si il y avait d'autres statisticiens (junior ? sénior ?) voir une équipe/service dédié. Cela nous permet de savoir si vous avez du travailler en plus ou moins grand autonomie.
- Quantité de travail : On ne se refait pas... les profs prennent plaisir à savoir que vous avez travaillé (en partie pendant leurs congés) ! Il est donc important que vous parliez de certains points (pourtant pas les plus glamours).
- Le nettoyage des données : cette tâche peut etre longue et fastitudueuse... nous le savons et si vous avez passé beaucoup de temps sur cette tâche il est important de le mentionner dans le rapport en etoffant votre propos de quelques exemples de problèmes/solutions que vous avez rencontrés/mis en oeuvre. L'integralité de votre travail peut interresser l'entreprise et il est peut être pertinent de mettre la liste complète des problèmes/solutions en annexe afin de faciliter la tâche d'un successeur.
- Plusieurs travaux : Le plus souvent vous aurez eu plusieurs tâches à effectuer. Dans le rapports vous détaillerez quelques exemples significatifs (où il y a eu des différences de méthodes/ de résultats), vous nous direz combien de fois vous avez du "faire le job". Dans le document annexe vous pourrez mettre l'intégralité des résultats.
- Developpement informatique : Avez vous utilisé des outils existants ou avez vous eu à programmer ? si oui en quel langage et, dans le rapport vous pouvez présenter l'algorithme en pseudo/code alors que l'integralité du code dans le langage utilisé a (peut être) sa place en annexe.
- Démarche scientifique : c'est la partie qui m'interresse le plus dans le rapport.
- Choix de la méthode : avez vous eu à choisir la méthode ou le choix vous a t'il été dicté par vos encadrants ? si vous avez choisi : pourquoi avez vous choisi telle ou telle méthode (théorie ou pratique : choix de la plus adaptée a postériori après plusieurs test).
- Explication de la méthode : Comment la méthode fonctionne ? si vous pouvez faire une introduction "la méthode pour ma grand mère qui ne connait rien aux stat" et un paragraphe : "la méthode pour Marie Curie" avec des vrais morceaux de science à l'interieur ca serait vraiment idéal.
- Résultats : Qu'avez vous obtenu comme résultats, ceux si sont ils surprenants ? attendus ?
- Recul sur la méthode : avez vous detecté des points faibles ? si oui avez vous des idées d'améliorations à apporter ?
Data Mining (M2)
Voici les supports de cours de M2 Std, ce cours, que j'ai donné de 2015 a 2021 a vu son volume horaire diminuer, les supports mis ici sont les plus complets mais les plus anciens... ils contiennent coquilles et autres imprécisions.En temps que supports de cours ils étaient aussi complétés par des informations au tableau, les transitions sont parfois assez abruptes, néanmoins j'éspère que ses transparents vous seront utiles.
- Introduction : choix de modèles, cross validation / Leave One Out.
- Réduction de dimension : MdS, Som, LLE.
- Classification supervisée
- Introduction : courbe roc, mesure erreur.
- SVM.
- arbres.
- resumé/exemples.
- EM/densité.
- Regression
- Introduction cas univarié.
- knn plus proches voisins, coefficient de correlation (non linéaire).
- preceptron.
- arbres.
- Grande dimension
- Introduction.
- PLS.
- regression sparse (Lasso/Ridge).