Archives mensuelles : juillet 2017

Naive Bayes Classifier pour Machine Learning

de Younes Benzaki | 26 juillet 2017

Naive Bayes Classifier est un algorithme populaire en Machine Learning. C’est un algorithme du Supervised Learning utilisé pour la classification. Il est particulièrement utile pour les problématiques de classification de texte. Un exemple d’utilisation du Naive Bayes est celui du filtre anti-spam. Regardons de plus prés comment fonctionne cet algorithme. Probabilités conditionnelles Le naive Bayes classifier se base… Lire la suite »

Data Scientist, Data Engineer, Data Analyst… Quelles sont les différences entre ces métiers ?

de Younes Benzaki | 18 juillet 2017

6 commentaires

Le métier de data Scientist fait le buzz ces derniers temps. Le magazine Harvard Business School va jusqu’à le considérer comme le métier le plus sexy du 21éme siècle. La Data Science reste un domaine large aux contours flous. Cela conduit à la prolifération de nouveaux termes pour désigner de nouveaux métiers (ou pas si… Lire la suite »

Overfitting et Underfitting : Quand vos algorithmes de Machine Learning dérapent !

de Younes Benzaki | 11 juillet 2017

11 commentaires

L’Overfitting (sur-apprentissage), et l’Underfitting (sous-apprentissage) sont les causes principales des mauvaises performances des modèles prédictifs générés par les algorithmes de Machine Learning. Dans cet article on verra ce que veut dire ces deux termes et dans quels cas ils se manifestent. A quel point est-elle bonne ma fonction de prédiction ? En apprentissage supervisé… Lire la suite »