Skip to content

Projet : Analyse de données sur un sujet d'actualité

Description du sujet

Dans ce projet, votre tâche consiste à récolter, structurer et analyser brièvement un jeu de données le plus vaste et varié possible afin de répondre à une problématique à portée sociétale, de votre choix Vous présenterez à la classe un panneau de bord (dashboard) résumant vos analyses et conclusions.

Le défi de ce projet réside dans le fait de récolter des données le plus variées, volumineuses et qualitatives possibles, afin de produire un travail de synthèse le plus complet possible sur le sujet que vous aurez choisi de développer.

Exemples de sujets

  • perspectives concernant l'évolution et projections et l'impact du pétrole dans le monde
  • les voitures électriques : la solution à ultime à la mobilité ?
  • analyse de l'impact des déchets plastiques sur l'environnement : quoi ? comment ? où ?

Constitution des équipes

Pour ce travail d'équipe, vous constituerez des groupes de 3 data scientist dans lesquels vous vous répartirez les rôles suivant les trois postes suivants :

  • Une personne responsable d'organiser la récolte des données et la gestion de projet
  • Une personne responsable d'organiser la préparation et la structuration des données
  • Une personne en charge de l'analyse des données et la communication des résultats

Bien entendu, je vous invite à collaborer le plus possible, vous pouvez travailler à plusieurs sur ces chacun des postes cités, mais nommez une personne qui sera responsable d'organiser cette tâche (organiser des réunions, faire le point des avancées, gérez ou effectuer les tâches à accomplir ... )

Données

Vous êtes libre d'utiliser des données provenant de n'importe quelle source à condition qu'elle soient partagées sous une licence qui autorise son exploitation.

Rendu & évaluations

Livrables

Vous organisez votre travail d'équipe en utilisant un dépôt sur Github ou Gitlab, hébergeant tout le code et la documentation nécessaire au développement et à l'utilisation de votre dashboard.

Enfin vous devrez avoir votre dashboard déployable (à minima en local) que vous présenterez lors de la soutenance

En résumé, vous devrez fournir les éléments suivants :

  • pour le dashboard : une notebook ou idéalement une page web
  • un lien vers votre dépôt Git

Si vous êtes limité par le volume de vos données, contactez moi pour que je vous ouvre un espace de stockage en ligne.

Soutenance

Chaque groupe présentera son travail à la classe pendant un créneau de 30 min maximum (présentations et questions comprises). Vous mettrez principalement en avant deux aspects:
- le détail des méthodes utilisée lors du choix des données, de leur structuration, de leur visualisation - vos analyses et résultats : quelle histoire pouvez vous raconter ?

Notation

Vous serez évalué par trois notes, chacune sur 20 :
- Une note de groupe évaluée sur l'ensemble du rendu du projet.
- Une note de groupe pour la soutenance orale de votre projet.
- Une note individuelle pour chaque étudiant responsable des postes évoqués plus haut

Critères d'évaluations:

Pour chacune des deux notes les critères généraux d'évaluation sont les suivants:

  • la variété, la quantité et la qualité des données que vous avez acquises pour le projet: Quelle nature de données différentes avez vous extraites ? Avez vous réussi à acquérir un volume de données conséquent ? Avez examiné la qualité de vos données ?
  • la structuration de vos données: Quelle démarche/outils avez vous mis en place pour structurer vos données ? Comment avez vous organisé votre chaîne de traitement de données ?
  • la clarté de la documentation de votre projet: Comment un utilisateur externe de votre dépôt pourrait il utiliser facilement votre projet ?
  • la pertinence de vos analyse et la qualité de vos explications: Quels analyses avez vous faites et pourquoi ? En quoi illustrent elle votre propos ? Avez vous commenté vos résultats ?

Bon courage à tous