Premier jour comme Data Scientist

Hello !
Cette suite de posts a pour objectif de partager l’envers du décor d’une mission comme Data Scientist. Démystifier ce chambard parce qu’on en entend des choses sur ce métier.

(Pour des raisons de clause de confidentialité, j’ai légèrement modifié les informations de la mission ou même à aucun moment je ne cite ladite entreprise mais l’idée est là).

Avant toute chose.

À ceux qui ne savent pas trop s’ils souhaitent vraiment devenir Data Scientist, voilà quelqu’un indicateurs : tu es passionnée par les données et les chiffres, tu es barge, tu aimes suivre des cours sur internet, tu essaies toujours d’en savoir plus, tu as une expertise dans un autre domaine, tu ne rechignes pas face aux tâches pas marrantes.


Trêve de bavardage !

La data science c’est de l’exploration méthodique pour obtenir des informations utiles. Dans cette optique, on pose différents types de question :

  • Que savons-nous de notre client ?
  • Comment livrer un meilleur produit ?
  • Que faisons-nous mieux que nos concurrents ?

Toutes ces questions nécessitent du taff or en entreprise on n’a pas toujours le temps. Je me souviens quand j’étais salairé, on ne m’invitait plus d’invitation pour les réunions parce que j’aimais bien posé beaucoup de questions, tout remettre en cause, savoir avoir la moindre d’idée de la réponse ou même de la manière de trouver des réponses à ces questions.

L’exploration de nouvelles questions est un bon moyen de progresser.

En général, on utiliser la Data Science de 3 manières en entreprise :

  • Utiliser l’existant pour générer des informations via des données et des algorithmes pour fournir à l’entreprise des informations qui améliorent les performances.
    Par exemple, la découverte d’une niche clientèle rentables qui devraient être traités différemment, comprendre les ventes perdues, l’impact d’une réduc, etc.
    Ce travail permet à l’entreprise de poser de nouvelles questions et obtenir de meilleures réponses à des questions existantes.
  • Ajouter dans l’existant un algorithme.
    Par exemple, développer un algorithmes dans un système de recommandations pour améliorer la précision.
  • Ajouter de nouvelles briques lorsque qu’il n’y a pas de système dans lequel intégrer la solution, il est nécessaire de créer de nouveaux produits. Est concernée tout système qui répète une action basée sur les données sans rien système.
    Par exemple, pour aider à comprendre le taux de désabonnement.

La mission dans cette série de posts est du premier type, à savoir utiliser l’existant pour tirer des choses.

Ensuite, il faut savoir qu’en général une mission se divise comme suit :

  • Identification du problème/solution (prochain post)
  • Préparation des données (post 3)
  • Exploration des données (post 4)
  • Modélisation (conception et validation)
  • Visualisation, évaluation des résultats (post 5)
  • (Optimiser le modèle, déployer)

Je vais volontairement ne pas montrer de code ou ne pas rentrer dans les détails techniques. Mon objectif est de rendre ces posts simples et courts. Donner une vue d’ensemble du cheminement et surtout du type de difficulté à affronter.