Data Scientist, Data Engineer, Data Analyst… Quelles sont les différences entre ces métiers ?

Le métier de data Scientist fait le buzz ces derniers temps. Le magazine Harvard Business School va jusqu’à le considérer comme le métier le plus sexy du 21éme siècle. La Data Science reste un domaine large aux contours flous. Cela conduit à la prolifération de nouveaux termes pour désigner de nouveaux métiers (ou pas si nouveau que ça… Read More »

Overfitting et Underfitting : Quand vos algorithmes de Machine Learning dérapent !

L’Overfitting (sur-apprentissage), et l’Underfitting (sous-apprentissage) sont les causes principales des mauvaises performances des modèles prédictifs générés par les algorithmes de Machine Learning. Dans cet article on verra ce que veux dire c’est deux termes et dans quels cas ils se manifestent.   A quel point est-elle bonne ma fonction de prédiction ? En apprentissage supervisé (Supervised Learning), un… Read More »

9 Algorithmes de Machine Learning que chaque Data Scientist doit connaitre

Le domaine du Machine Learning regorge d’algorithmes pour répondre à différents besoins. Chacun a ses spécificités mathématiques et algorithmiques. Pour quelqu’un qui débute dans le domaine, cela peut ne pas être évident à appréhender. J’ai compilé cette liste regroupant 9 algorithmes de Machine Learning les plus basiques mais redoutables pour mieux vous retrouver dans cette foire aux algos… Read More »

10 minutes pour comprendre la régression polynomiale

Vous avez 10 minutes de temps libre pour comprendre la régression polynomiale pour faire des prédictions ? Cet article est fait pour vous ! c’est parti ! 🙂 Après l’article sur la régression linéaire univariée et la régression linéaire multivariée, on va maintenant attaquer la régression polynomiale. Cette dernière est tout simplement une généralisation de la régression linéaire multivariée. L’intérêt… Read More »

Gradient Descent : Théorie et pratique… La magie du Machine Learning démystifiée !

Dans cet article, on verra comment fonctionne L’algorithme Gradient Descent pour calculer les modèles prédictifs. Depuis quelque temps maintenant, je couvrais la régression linéaire, univariée, multivariée, et polynomiale. Tout au long de ces articles, je parlais de fonction/modèle prédictif. Mais je ne m’étais jamais attardé à expliquer comment se calcule la fonction de prédiction fournit par les librairies ML. Dans… Read More »

5 Conseils d’experts pour apprendre le Machine Learning

La Data Science et le Machine Learning sont des compétences rares très demandées dans le marché du travail. Ce domaine aux contours assez flous, demande une expertise pluridisciplinaire. Maîtriser le calcul matriciel, les probabilités, la programmation ainsi que les principaux algorithmes ML demande un travail colossal ! Nul doute, apprendre le machine learning prend du temps. mais on veut tous… Read More »

Comment représenter les données en Machine Learning ?

En machine Learning, les données sont le nerf de la guerre. Et vu leurs importances, j’ai décidé d’écrire cet article sur comment représenter les données en machine learning et les types de données le plus souvent rencontrés. Peu importe à quel point votre algorithme est sophistiqué, sans un nombre suffisant de données d’entrainement, il sera incapable de fournir… Read More »

Implémenter la régression linéaire multivariée en Python

Lors de mon précédent article, je vous ai montré comment implémenter la régression linéaire en utilisant une seule variable prédictive. Toutefois, une variable cible est généralement prédite non seulement avec une seule variable prédictive mais avec plusieurs. Dans ce cas, on parle de régression linéaire multivariée (Multivariate Linear Regression). Dans cet article, on en implémentera une en utilisant les libraires… Read More »

Régression linéaire en Python par la pratique

Dans cet article, je vais implémenter la régression linéaire univariée (à une variable) en python. Le but est de comprendre cet algorithme sans se noyer dans les maths régissant ce dernier. Il s’agit d’un algorithme d’apprentissage supervisé de type régression. Les algorithmes de régression permettent de prédire des valeurs continues à partir des variables prédictives. Prédire le prix d’une maison en fonction de… Read More »

2 livres en français à lire pour s’initier à la data science

La littérature française traitant le Machine Learning et la data science est peu abondante. Par ailleurs, voici une sélection courte, composée de deux livres français très intéressant à lire pour mieux s’initier dans la science de données. Note : Je ne fais pas la publicité pour ces deux livres, je l’ai ai lu et ils m’ont plu et… Read More »