Skip to content

Création d'une "application data"

Description du sujet

Pour ce devoir, vous allez créer une application exploitant des données pour répondre à un problème réaliste, au choix parmi les deux sujets ci dessous, ou à choisir librement (à faire valider par l'enseignant) dans les thématiques de la santé, l'environnement ou le social.

Vous produirez un logiciel utilisable à minima en local et bénéficierez de points supplémentaires si vous avez réalisé son déploiement. Dans tous les cas, vous devez produire une documentation détaillée de votre démarche (données, méthodes d'analyses, code, instructions d'utilisation), logiciel utilisable

Sujets proposés

Sujet 1 : Construire un système de recommandation de produits alimentaires

Sujet 2 : Construire un logiciel pour calculer l'empreinte écologique d'usagers (personnes ou organisations) en fonction de leur caractéristiques (par exemple : les habitudes de consommation, leur mode de transport, les caractéristiques de leur logements)

Sujet 3 : Construire un logiciel pour calculer le bilan carbone d'une entreprise.

Constitution des équipes

Pour ce travail d'équipe, vous constituerez des groupes de 3 data scientists dans lesquels vous vous répartirez les rôles suivant les trois postes suivants :

  • Une personne responsable d'organiser la récolte, structuration et préparation des données
  • Une personne responsable d'organiser la l'analyse et l'interprétation des résultats
  • Une personne en charge de l''architecture, la conception et la mise en production de l'application

Rendu & évaluations

Livrables

Vous devrez fournir les éléments suivants :

  • un lien vers un dépôt git bien documenté expliquant en détail le fonctionnement de votre logiciel, les méthodes d'analyses et le code utilisé.
  • si vous avez déployé votre logiciel, une url sur laquelle est accessible logiciel.

Soutenance

Chaque groupe présentera son travail à la classe pendant un créneau de 25 min maximum + 10 min de questions. Vous mettrez principalement en avant les aspects suivants:

  • la méthodologie utilisée pour concevoir votre application
  • une discussions des analyses et résultats obtenus
  • si possible, une démo de votre solution

Critères d'évaluation

Pour chacune des deux notes les critères généraux d'évaluation sont les suivants:

  • la variété, la quantité et la qualité des données que vous avez collectées pour le projet: Quelle nature de données différentes avez vous extraites ? Avez vous réussi à acquérir un volume de données conséquent ? Avez examiné la qualité de vos données ?

  • la structuration de vos données: Quelle démarche/outils avez vous mis en place pour structurer vos données ? Comment avez vous organisé votre chaîne de traitement de données ?

  • la qualité de la documentation de votre dépôt git: Comment un utilisateur externe de votre dépôt pourrait il comprendre et utiliser facilement votre projet ?

  • la pertinence de vos analyses et la qualité de vos explications: Quels analyses avez vous faites et pourquoi ? En quoi illustrent elle votre propos ? Avez vous commenté vos résultats ?

  • la clarté de présentation de votre projet

Notation

Vous serez évalué par les notes suivantes, chacune sur 20 :

  • Une note de groupe évaluant la qualité globale de votre rendu (méthodologie, code, analyses, visualisations, documentation).
  • Une note de groupe évaluant la qualité de la soutenance orale de votre projet.
  • une note individuelle évaluant votre contribution en fonction de votre rôle défini dans le projet