Category Archives: Machine Learning

Machine Learning

Installer un environnement Python pour Machine Learning avec Anaconda

L’installation de Python peut-être un vrai challenge. Déjà il faut se décider entre les versions 2.X et 3.X du langage. Et par la suite, choisir les librairies nécessaires (ainsi que les versions compatibles) pour faire du Machine Learning. Sans oublier les subtilités liées aux différents OS (Windows, Linux, Mac…) qui peuvent rendre l’installation encore plus douloureuse. Cet article… Read More »

Logistic Regression pour Machine Learning – Une Introduction Simple

Logistic regression (régression logistique) est un algorithme supervisé  de classification, populaire en Machine Learning. Lors de cet article, nous allons détailler son fonctionnement pour la classification binaire et par la suite on verra sa généralisation sur la classification multi-classes. La classification en Machine Learning La classification est une tâche très répandue en Machine Learning. Dans ce genre de problématique, on… Read More »

Machine Learning applications : 10 cas d’usage pratiques

Machine Learning est un mot en vogue ces derniers temps. En réalité, pour avoir une meilleure intuition sur ce concept, il n’y a pas mieux que de comprendre les types de problèmes que l’apprentissage automatique tente de résoudre. Cet article énuméra 10 applications du Machine Learning les plus communes. Non seulement ces cas d’usages vous donneront une idée sur… Read More »

Implémentation d’un SPAM Filter avec Naive Bayes Classifier et Python

Lors de l’article précédent, j’ai expliqué le principe de fonctionnement du Naive Bayes Classifier. Ce dernier est un algorithme de Machine Learning particulièrement prisé pour l’analyse et la classification de texte. Durant cet article, on mettra en place un “SPAM Filter” en utilisant le Naive Bayes Classifier. Notre classifieur se basera sur Python et sa librairie de Machine Learning :… Read More »

Naive Bayes Classifier pour Machine Learning

Naive Bayes Classifier est un algorithme populaire en Machine Learning. C’est un algorithme du Supervised Learning utilisé pour la classification. Il est particulièrement utile pour les problématiques de classification de texte. Un exemple d’utilisation du Naive Bayes est celui du filtre anti-spam. Regardons de plus prés comment fonctionne cet algorithme. Probabilités conditionnelles Le naive Bayes classifier se base sur le théorème… Read More »

Data Scientist, Data Engineer, Data Analyst… Quelles sont les différences entre ces métiers ?

Le métier de data Scientist fait le buzz ces derniers temps. Le magazine Harvard Business School va jusqu’à le considérer comme le métier le plus sexy du 21éme siècle. La Data Science reste un domaine large aux contours flous. Cela conduit à la prolifération de nouveaux termes pour désigner de nouveaux métiers (ou pas si nouveau que ça… Read More »

Overfitting et Underfitting : Quand vos algorithmes de Machine Learning dérapent !

L’Overfitting (sur-apprentissage), et l’Underfitting (sous-apprentissage) sont les causes principales des mauvaises performances des modèles prédictifs générés par les algorithmes de Machine Learning. Dans cet article on verra ce que veut dire ces deux termes et dans quels cas ils se manifestent.   A quel point est-elle bonne ma fonction de prédiction ? En apprentissage supervisé (Supervised Learning), un… Read More »

9 Algorithmes de Machine Learning que chaque Data Scientist doit connaitre

Le domaine du Machine Learning regorge d’algorithmes pour répondre à différents besoins. Chacun a ses spécificités mathématiques et algorithmiques. Pour quelqu’un qui débute dans le domaine, cela peut ne pas être évident à appréhender. J’ai compilé cette liste regroupant 9 algorithmes de Machine Learning les plus basiques mais redoutables pour mieux vous retrouver dans cette foire aux algos… Read More »

Régression Polynomiale (Polynomial regression) – Implémentez-la en 10 minutes !

Vous avez 10 minutes de temps libre pour comprendre la régression polynomiale (Polynomial Regression) pour faire des prédictions ? Cet article est fait pour vous ! c’est parti ! 🙂 Après l’article sur la régression linéaire univariée et la régression linéaire multivariée, on va maintenant attaquer la régression polynomiale. Cette dernière est tout simplement une généralisation de la régression linéaire… Read More »

Gradient Descent Algorithm : Explications et Implémentation en Python

Dans cet article, on verra comment fonctionne L’algorithme de Gradient (Gradient Descent Algorithm) pour calculer les modèles prédictifs. Depuis quelques temps maintenant, je couvrais la régression linéaire, univariée, multivariée, et polynomiale. Tout au long de ces articles, je parlais de fonction/modèle prédictif. Mais je ne m’étais jamais attardé à expliquer comment se calcule la fonction de prédiction fournie par les… Read More »