Monthly Archives: juillet 2017

Naive Bayes Classifier pour Machine Learning

Naive Bayes Classifier est un algorithme populaire en Machine Learning. C’est un algorithme du Supervised Learning utilisé pour la classification. Il est particulièrement utile pour les problématiques de classification de texte. Un exemple d’utilisation du Naive Bayes est celui du filtre anti-spam. Regardons de plus prés comment fonctionne cet algorithme. Probabilités conditionnelles Le naive Bayes classifier se base sur le théorème… Read More »

Data Scientist, Data Engineer, Data Analyst… Quelles sont les différences entre ces métiers ?

Le métier de data Scientist fait le buzz ces derniers temps. Le magazine Harvard Business School va jusqu’à le considérer comme le métier le plus sexy du 21éme siècle. La Data Science reste un domaine large aux contours flous. Cela conduit à la prolifération de nouveaux termes pour désigner de nouveaux métiers (ou pas si nouveau que ça… Read More »

Overfitting et Underfitting : Quand vos algorithmes de Machine Learning dérapent !

L’Overfitting (sur-apprentissage), et l’Underfitting (sous-apprentissage) sont les causes principales des mauvaises performances des modèles prédictifs générés par les algorithmes de Machine Learning. Dans cet article on verra ce que veut dire ces deux termes et dans quels cas ils se manifestent.   A quel point est-elle bonne ma fonction de prédiction ? En apprentissage supervisé (Supervised Learning), un… Read More »