Monthly Archives: octobre 2017

Data visualisation (Dataviz) en Data Science

La visualisation des données (Data visualisation / Dataviz) est un domaine familier chez presque, tous les data scientist. Elle permet de tirer rapidement des informations grâce  aux représentations graphiques. La visualisation des données s’incorpore dans diverses phases du workflow d’un projet de Data Science. Notamment lors de l’exploration de données, visualisation des performances d’un Algorithme de Machine Learning… Read More »

Data Science : Exploration de données avec Python et les statistiques

L’exploration de données est une étape importante du workflow de Data science. Toutefois, Les gens ne s’y attardent pas beaucoup, souvent à tort. La phase d’exploration de données permet de comprendre ses dernières. Grâce à l’analyse univariée et multivariée, on peut déduire certaines hypothèses qui pourront servir lors de la phase de modélisation. L’analyse univariée permet d’explorer une… Read More »

Data preprocessing : Feature Scaling avec Python

Les données sont au centre des algorithmes de Machine Learning. Par conséquent, préparer au mieux ces données, permettra d’avoir de meilleures performances. La plupart du temps, en machine Learning, les Data Set proviennent avec des ordres de grandeurs différents. Cette différence d’échelle peut conduire à des performances moindres. Pour palier à cela, des traitements préparatoires sur les données existent. Notamment le… Read More »

Data Science Workflow pour mieux construire un Data Product

Data science, Big Data et Machine Learning sont des termes populaires ces dernières années. Toutefois, les périmètres qu’englobent chacun de ces termes se chevauchent, tout en signifiant des choses différentes. Ce qui pourrait prêter à confusion ! Dans cet article, je vais décrire le flux de travail (workflow) d’un data scientist pour construire un Data product. Typiquement, j’expliquerai comment s’imbrique le Machine Learning et… Read More »