Skip to content

Projet : Analyse de données sur un sujet d'actualité

Description du sujet

Dans ce projet, votre tâche consiste à récolter, structurer et analyser brièvement un jeu de données le plus vaste et varié possible afin de répondre à une problématique à portée sociétale, de votre choix Vous présenterez à la classe un panneau de bord (dashboard) résumant vos analyses et conclusions.

Le défi de ce projet réside dans le fait de récolter des données le plus variées, volumineuses et qualitatives possibles, afin de produire un travail de synthèse le plus complet possible sur le sujet que vous aurez choisi de développer.

Exemples de sujets

  • Perspectives concernant l'évolution et les projections et l'impact du pétrole dans le monde
  • Les voitures électriques : la solution ultime à la mobilité ?
  • Analyse de l'impact des déchets plastiques sur l'environnement : quoi ? comment ? où ?

Constitution des équipes

Pour ce travail d'équipe, vous constituerez des groupes de 3 data scientists dans lesquels vous vous répartirez les rôles suivants :

  • Une personne responsable d'organiser la récolte des données et la gestion de projet
  • Une personne responsable d'organiser la préparation et la structuration des données
  • Une personne en charge de l'analyse des données et la communication des résultats

Bien entendu, je vous invite à collaborer le plus possible, vous pouvez travailler à plusieurs sur chacun des postes cités, mais nommez une personne qui sera responsable d'organiser cette tâche (organiser des réunions, faire le point des avancées, gérer ou effectuer les tâches à accomplir ... )

Données

Vous êtes libre d'utiliser des données provenant de n'importe quelle source à condition qu'elles soient partagées sous une licence qui autorise leur exploitation.

Rendu & évaluations

Livrables

Vous organiserez votre travail d'équipe en utilisant un dépôt sur GitHub ou GitLab, hébergeant tout le code et la documentation nécessaire au développement et à l'utilisation de votre dashboard.

Enfin vous devrez avoir votre dashboard déployable (à minima en local) que vous présenterez lors de la soutenance

En résumé, vous devrez fournir les éléments suivants :

  • Pour le dashboard : une notebook ou idéalement une page web
  • Un lien vers votre dépôt Git

Si vous êtes limité par le volume de vos données, contactez-moi pour que je vous ouvre un espace de stockage en ligne.

Soutenance

Chaque groupe présentera son travail à la classe pendant un créneau de 30 min maximum (présentations et questions comprises). Vous mettrez principalement en avant deux aspects:
- Le détail des méthodes utilisées lors du choix des données, de leur structuration, de leur visualisation - Vos analyses et résultats : quelle histoire pouvez-vous raconter ?

Notation

Vous serez évalué par 3 notes, chacune sur 20 :
- Une note de groupe évaluée sur l'ensemble du rendu du projet.
- Une note de groupe pour la soutenance orale de votre projet.
- Une note individuelle pour chaque étudiant responsable des postes évoqués plus haut

Critères d'évaluations:

Pour chacune des trois notes les critères généraux d'évaluation sont les suivants:

  • La variété, la quantité et la qualité des données que vous avez acquises pour le projet: Quelle nature de données différentes avez vous extraites ? Avez-vous réussi à acquérir un volume de données conséquent ? Avez-vous examiné la qualité de vos données ?
  • La structuration de vos données: Quelle démarche/outils avez-vous mis en place pour structurer vos données ? Comment avez-vous organisé votre chaîne de traitement de données ?
  • La clarté de la documentation de votre projet: Comment un utilisateur externe de votre dépôt pourrait-il utiliser facilement votre projet ?
  • La pertinence de vos analyse et la qualité de vos explications: Quels analyses avez-vous faites et pourquoi ? En quoi illustrent-elled votre propos ? Avez-vous commenté vos résultats ?

Bon courage à tous