Pour continuer votre formation
Data Science
Programmation en python
Pour trouver des ressources pertinentes en fonction de votre expérience en python, référez vous au Chapitre 2 du cours Data Science
Programmation orientée objet en python
Si vous souhaitez approfondir vos connaissances sur la programmation orienté objet en python, vous pouvez suivre ces cours d'Open Classrooms, en fonction de votre besoin:
Mini cours
Récemment la plateforme kaggle à mise en place des mini cours accompagnés d'exercices corrigés par chapitres qui sont rapides à faire. Ces cours vous permettront de découvrir certaines notions fondamentales, que vous aurez l'occasion de creuser par la suite.
Je vous conseille, en fonction de votre niveau de connaissance, et par ordre de priorité de suivre les mini cours suivants:
- l'apprentissage de pandas le module de python le plus utilisé pour gérer les données tabulaires
- l'introduction aux bases du langage SQL pour la manipulation de base de données. Optionnellement, vous pouvez allez plus loin, en explorant des fonctionnalités plus avancées du langage SQL, notamment en apprenant à combiner plusieurs tables
- apprendre les principes de base du nettoyage de données et pourrez compléter vos connaissances en testant des méthodes d'apprentissage automatique pour le pré-traitement de données en explorant le menu dédié du framework sckit-learn. Pour aller encore plus loin, vous pouvez tester les algorithmes d'apprentissage semi-supervisé pour la labellisation automatique de donnée du même framework
- enfin vous pouvez terminer votre apprentissage des principes de bases en étudiant le feature engineering
Eléments de cours par thématique
Algorithmie
Vous pourrez découvrir des bases pratiques de l'algorthmie avec ce cours d'Open Classroom. Je vous conseille de cibler en particulier les chapitres concernant les structure de données files, listes et arbres
Cours francophones complets
Les cours suivants sont des cours très complet qui sont dispensés dans des masters spécialisés dans la data science. Vous n'aurez probablement pas le temps de les explorer complètement, je vous conseille de vous y référer uniquement quand vous avez besoin d'approfondir un sujet précis ou pour rechercher des exercices supplémentaires
- les cours de Ricco Rakatomala enseignant dans master SISE de Lyon 2 consacré à la data science et au data mining sont une mine de ressources si vous souhaitez creuser en détails les aspects mathématiques
- le cours du module de data science du cours de l'ENSAE à Paris
Mathématiques pour la data science et le machine learning
Livres
- Afin d'approfondir en continu votre apprentissage des mathématiques de bases pour la data science et le machine learning, n'hésitez pas à fouiller parmi les chapîtres du livre mathematics for machine learning lorsque vous aurez besoin d'approfondir certaines notions fondamentales ou d'en découvrir d'autres.
- An introduction to statistical learning est un ouvrage de référence, quasiement la bible de la data science et du machine learning !
Je vous conseille de le consulter lorsque vous aurez déja un niveau de base en data science et machine learning et que vous aurez besoin de vous plonger dans les mathématiques détaillées d'un concept particulier
Cours & vidéos
Je vous invite à continuer à vous former tout au long du cours, au fur et a mesure que vous aurez besoin d'approfondir certaines notions.
- Vous trouverez sur cet article de blog de toward data science une liste très complète de ressources pour acquérir les fondamentaux de maths pour la data science
- Pour explorer certains sujets précis, vous pouvez lire cette serie d'articles thématiques par Hadrien Jean (tiré de son livre)
- Enfin, si vous débutez et souhaiter apprendre les mathématiques depuis un niveau collège, je vous conseille les cours de la plateforme khan academy (vous trouverez beaucoup de contenus en français)
Algèbre linéaire
L'algèbre linéaire est un domaine des mathématiques dont vous aurez particulièrement besoin durant ce cours pour comprendre les notions de vecteurs, matrices, tenseurs et leurs opérations associées.
-
Je vous conseille de regarder l'intégralité de la série de vidéos Essence of linear algebra, de l'excellente chaîne de vulgarisation mathématique 3Blue1Brown
-
En français, je vous conseille la série de cours vidéo de khan academy :
- les vecteurs & espaces vectoriels
- les matrices d'applications linéaires
Analyse fonctionnelle et calul
Je vous conseille de regarder l'intégralité de la série de vidéos Essence of calculus, de l'excellente chaîne de vulgarisation mathématique 3Blue1Brown
Statistiques
Le site statorials propose de nombreux tutos appliqués en python pour les statistiques descriptives et inférentielles
Machine Learning
Introduction au Machine Learning
-
Je vous recommande de lire la page tutoriel de scikit-learn qui vous introduit quelques bases du machine learning accompagnées d'exemples qui vous permettront d'apprendre à programmer avec ce framework indispensable.
-
La page des ressources éducatives du framework tensorflow propose plein de livres et de cours (dont la plupart sont gratuits) que vous pouvez explorer pour développer vos connaissances théoriques et techniques sur le machine learning et le deep learning.
Cours complets
Anglophones
- La plateforme Kaggle propose maintenant des cours accompagnés d'exercices concernant le machine learning, Intro to Machine Learning et Intermediate Machine Learning que je vous conseille de faire si possible en intégralité.
Francophones
- La plateforme Open Classrooms propose deux cours assez complets que vous pouvez suivre en sélectionnant les chapitres qui compléteront le plus vos connaissances : perfectionnez vos bases avec le cours Initiez vous au machine learning et avec approfondissez les notions d'évaluation vos algorithmes en évitant le biais de sur apprentissage cours Evaluez les performances d'un modèle de machine learning
Par thématique
- Un article du blog towards data science vulgarisé sur les paramètres et hyper-paramètres des réseaux de neurones
Deep Learning
Ressources généralistes
La page des ressources éducatives du framework tensorflow propose un contenu très riche contenant livres, cours en ligne, concepts mathématiques, ressources tensorflow, ... Je vous conseille vivement de vous y référez pour développer vos connaissances théoriques et techniques (pour le machine learning et le deep learning) et vous aider pour la réalisation des projets.
Bien que les cours francophones proposés soient de bonne qualité, je vous conseille de suivre les cours en anglais, car ils sont généralement plus nombreux et plus complets.
Livres
Deep learning, par Ian Goodfellow, Yoshua Bengio and Aaron Courville, est un livre de référence pour un apprentissage complet des bases théoriques du deep learning
Eléments de cours en ligne
Anglophones
Gratuits
-
Les vidéos de découverte des reseaux de neurones de Hugo Larochelle vous permettent de découvrir en 92 courtes présentations (excédant rarement les 15 minutes) des points clés pour compléter votre compréhension de certains sujets
-
Le cours offrant le meilleur compromis exhaustivité/temps que je vous conseille de regarder en priorité et en intégralité (il dure moins d'une heure), est ce cours récent d'introduction au Deep Learning par le MIT
- Ce cours Standford est un des meilleur et des plus complet sur le sujet. Vous pouvez retrouverez les vidéos des cours magistraux ici
- Le cours fast.ai est un très bon cours, destiné aux programmeurs pour apprendre l'essentiel de la technique et de la théorie rapidement. Concentrez vous en particulier sur la leçon 1.
- Ce cours de Michael Nielsen extrait de son livre, est très illustré et vous permettra de peaufiner certains points particuliers
Payants
- Ce cours de Andrew Ng, un des pionniers du deep learning est disponible sur la plateforme Coursera
Francophones
Gratuits
-
Les cours de la plateforme Fidle (co-crée) par le CNRS est un cours en francais les plus complets : il reprend les conceptes fondamentaux en cours vidéo et est mis à jour régulièrement avec les dernières avancées
-
Le cours d'OpenClassroom, Initiez vous au deep learning. Le cours du CNAM couvre assez rapidement les principes généraux. Les diapositives du cours sont en anglais.
-
Pour ceux qui ne connaissent pas le machine learning, vous pouvez suivre ce cours d'initiation d'OpenClassroom
-
Vous trouverez des fiches de cours de bonne qualité, précises et détaillées, sur des points spécifiques ( comme la descente de gradient, le perceptron) sur le cours du Master SISE de Lyon
Payants
- La plateforme Udemy à ouvert un cours sur le deep learning, c'est probablement le plus complet en français à l'heure actuelle.
Etat de l'art
Je vous conseille l'excellent site papers with code qui référence une bonne partie de l'état de l'art, par tâches, en proposant des articles récents et leur code correspondants.
Lectures par thématiques
- Un article du blog towards data science vulgarisé sur les paramètres et hyper-paramètres des réseaux de neurones
- Si vous êtes intéressé par le Natural Language Processing et que vous souhaitez approfondir le sujet de manière détaillée, je vous suggère de regarder la série de vidéos du cours dédié de Standford CS224N
Mathématiques pour le deep learning
Algèbre linéaire
L'algébre linéaire est un domaine des mathématiques dont vous aurez particulièrement besoin durant ce cours pour comprendre les notions de vecteurs, matrices, tenseurs et leurs opérations associées.
- Cette série de cours vidéos de la chaine 3Blue1Brown vous aidera à apprendre les bases de l'algèbre linéaire, en particulier les notions de vecteurs, d'espaces vectoriels et de matrices. Je vous conseille de vous concentrer sur les videos 1,2,3,4,9,10 et 11
Tutoriels & Exercices
Deep Learning
-
La section tutoriel de Tensorflow est complète et détaillée. Commencez par la section pour les débutants. Vous pourrez exécuter le code proposé dans Colab, le notebook proposé par Google
-
La section tutorial de PyTorch contient des exercices et des applications classique du deep learning. Je vous recommande en particulier le tutoriel deep learning 60min blitz pour apprendre à manipuler le framework