Data Scientist, Data Engineer, Data Analyst… Quelles sont les différences entre ces métiers ?

By | 18 juillet 2017
0 Flares Twitter 0 LinkedIn 0 Reddit 0 Google+ 0 Filament.io 0 Flares ×

Le métier de data Scientist fait le buzz ces derniers temps. Le magazine Harvard Business School va jusqu’à le considérer comme le métier le plus sexy du 21éme siècle.

La Data Science reste un domaine large aux contours flous. Cela conduit à la prolifération de nouveaux termes pour désigner de nouveaux métiers (ou pas si nouveau que ça !). Parmi ces buzzwords, on retrouve : Data Scientist, Data Engineer, Data Analyst et B.I Developer. Ces métiers sont parfois méconnus ce qui ouvre la porte à la confusion.

Pour y remédier, regardons de plus prés à quoi aspire chaque métier et quelles sont les différences qui les caractérisent.

Data Analyst

Un analyste de données, est un quelqu’un qui est capable d’interroger des sources de données pour en faire des rapports et des visualisations graphiques (graphes camemberts, histogrammes etc…). Un Data Analyst a une compréhension forte du domaine métier dans lequel il opère. Ce qui lui permet de mieux communiquer avec les gens du métier.

Pour mieux explorer les données, un Data Analyst est généralement à l’aise avec les outils statistiques. Toutefois, il n’est pas forcement aussi “calé” techniquement qu’un software engineer pour traiter les grands volumes de données (Big Data).

Compétences et outils : Excel, Access, SQL, SPSS, Tableau, Statistiques…

Business Intelligence Developer

Les développeurs B.I. (Business Intelligence / informatique décisionnelle) vont mettre en place des outils de B.I. pour les besoins de l’entreprise. Ces outils se présentent généralement sous forme de Data warehouses, Datamart, ainsi que des bases de données multidimensionnelles construits à partir d’agrégation de données en provenance de plusieurs bases de données. La construction des Data warehouse et les bases OLAP est généralement effectuée à travers des Job ETL (Extract, Transform, Load) en utilisant l’outil Talend par exemple.

Ces Bases de données multidimensionnelles et Data warehouses sont par la suite utilisées par les développeurs B.I pour construire des tableaux de bords (Dashboards) et des rapports utiles pour les manageurs et les décideurs.

Les développeurs de B.I. ont généralement une connaissance métier moindre que celle d’un Data Analyst. Cependant, ils sont plus “calés” techniquement pour s’interfacer avec les différentes sources de données.

Compétences et outils : SQL, OLAP, Data warehouses, Cubes, SSAS, SSIS, ETL (Talend…)

Compétences requises par chaque profil dans le domaine de la data science

Data Engineer

Un Data Engineer est quelqu’un ayant un background technique en développement logiciel. Il peut être un Software Engineer qui s’est reconverti dans le Big Data.

Les Data Engineers vont mettre en place des systèmes de Big Data pour traiter ces dernières. Ils opteront pour des outils de stockage performants comme les bases de données NoSQL et se baseront sur  HadoopSpark, Map/Reduce pour traiter convenablement ces grands volumes de données.

Les Data Engineer vont collecter, transformer les données de différentes sources. Ce travail préparatoire permettra d’avoir des données “propres”, prêtes pour qu’on leur applique dessus des techniques de Machine Learning.

En d’autres termes, le travail d’un Data Engineer est de préparer le terrain pour qu’un Data Scientist puisse se servir des données propres pour en tirer des tendances (Insights).

Compétences et outils : SQL, NoSQL, Hadoop, Data Lake, Big Data, Spark, Software Engineering, Map/Reduce…

Data Scientist

Un Data Scientist est un profil pluridisciplinaire qui aura pour mission première de tirer de l’information utile (insights) depuis des données brutes. Le métier du Data Scientist est à l’intersection entre Data Analyst et de Data Engineer. Tout en ayant des connaissances métiers dans le domaine dans lequel il évolue.

En effet, un Data scientist va explorer et exploiter les gisements de données de l’entreprise pour leur appliquer des techniques de machine learning. Il s’agit donc d’une forme de Data Analysis poussée sur de grands volumes de données. L’exposition au contexte Big Data exige qu’un Data Scientist soit familier avec des concepts comme Map/Reduce, Hadoop, Data lake etc…

L’information utile recherchée par un Data Scientist est spécifique à une entreprise et plus généralement à un domaine métier. Pour cela, un Data Scientist doit être à l’aise avec le domaine métier dans lequel il opère. Pour cela, il côtoiera les gens du métier pour creuser avec eux les différentes pistes de réflexion.

Finalement, un data scientist doit être un bon communicant pour mieux communiquer ses retrouvailles. Il usera pour cela des différents supports de présentation comme les présentations PowerPoint, ainsi que des visualisations graphiques (histogrammes, camemberts…) plus parlantes aux décideurs.

Compétences et outils : SQL, NoSQL, Python, R, Machine Learning, Deep Learning, Statistiques, Software Engineering…

 

Inscrivez-vous à la Newsletter
Rejoignez la communauté Mr mint, le blog Français dédié à la Data Science et recevez des contenus exclusifs et d'autres goodies !
Nous détestons les spams. Votre adresse e-mail ne sera pas vendue ou partagée avec quelqu'un d'autre.
0 Flares Twitter 0 LinkedIn 0 Reddit 0 Google+ 0 Filament.io 0 Flares ×

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *