Création d'une "application data"
Description du sujet
Pour ce devoir, vous allez créer une application exploitant des données pour répondre à un problème réaliste, au choix parmi les deux sujets ci dessous, ou à choisir librement (à faire valider par l'enseignant) dans les thématiques de la santé, l'environnement ou le social.
Vous produirez un logiciel utilisable à minima en local et bénéficierez de points supplémentaires si vous avez réalisé son déploiement. Dans tous les cas, vous devez produire une documentation détaillée de votre démarche (données, méthodes d'analyses, code, instructions d'utilisation), logiciel utilisable
Sujets proposés
Sujet 1 : Construire un système de recommandation de produits alimentaires
Sujet 2 : Construire un logiciel pour calculer l'empreinte écologique d'usagers (personnes ou organisations) en fonction de leur caractéristiques (par exemple : les habitudes de consommation, leur mode de transport, les caractéristiques de leur logements)
Sujet 3 : Construire un logiciel pour calculer le bilan carbone d'une entreprise.
Constitution des équipes
Pour ce travail d'équipe, vous constituerez des groupes de 3 data scientists dans lesquels vous vous répartirez les rôles suivant les trois postes suivants :
- Une personne responsable d'organiser la récolte, structuration et préparation des données
- Une personne responsable d'organiser la l'analyse et l'interprétation des résultats
- Une personne en charge de l''architecture, la conception et la mise en production de l'application
Rendu & évaluations
Livrables
Vous devrez fournir les éléments suivants :
- un lien vers un
dépôt git
bien documenté expliquant en détail le fonctionnement de votre logiciel, les méthodes d'analyses et le code utilisé. - si vous avez déployé votre logiciel, une
url
sur laquelle est accessible logiciel.
Soutenance
Chaque groupe présentera son travail à la classe pendant un créneau de 25 min maximum + 10 min de questions. Vous mettrez principalement en avant les aspects suivants:
- la méthodologie utilisée pour concevoir votre application
- une discussions des analyses et résultats obtenus
- si possible, une démo de votre solution
Critères d'évaluation
Pour chacune des deux notes les critères généraux d'évaluation sont les suivants:
-
la variété, la quantité et la qualité des données que vous avez collectées pour le projet: Quelle nature de données différentes avez vous extraites ? Avez vous réussi à acquérir un volume de données conséquent ? Avez examiné la qualité de vos données ?
-
la structuration de vos données: Quelle démarche/outils avez vous mis en place pour structurer vos données ? Comment avez vous organisé votre chaîne de traitement de données ?
-
la qualité de la documentation de votre dépôt git: Comment un utilisateur externe de votre dépôt pourrait il comprendre et utiliser facilement votre projet ?
-
la pertinence de vos analyses et la qualité de vos explications: Quels analyses avez vous faites et pourquoi ? En quoi illustrent elle votre propos ? Avez vous commenté vos résultats ?
-
la clarté de présentation de votre projet
Notation
Vous serez évalué par les notes suivantes, chacune sur 20 :
- Une note de groupe évaluant la qualité globale de votre rendu (méthodologie, code, analyses, visualisations, documentation).
- Une note de groupe évaluant la qualité de la soutenance orale de votre projet.
- une note individuelle évaluant votre contribution en fonction de votre rôle défini dans le projet