Introduction au Machine learning : Définitions et Concepts

By | 22 novembre 2016
0 Flares Twitter 0 LinkedIn 0 Reddit 0 Google+ 0 Filament.io 0 Flares ×

Lors de cet article, je ferai une introduction au Machine Learning. Cette branche de l’intelligence artificielle est très à la mode ces dernières années. Toutefois, le Machine Learning est encore méconnu d’un grand nombre de gens.

A l’issu de cet article, vous saurez ce que veut dire le Machine Learning, Supervised Learning et Unsupervised Learning.

C’est parti !

machine_learning

Qu’est ce que le Machine Learning (ML)

Le Machine Learning est une branche de l’intelligence artificielle qui a pour but de donner la possibilité aux ordinateurs d’apprendre. Un ordinateur n’est pas intelligent, il ne fait qu’exécuter des tâches. On lui décrit sous forme de programmes quoi faire et comment le faire. C’est ce qu’on appelle la programmation.

Le machine Learning traite des sujets complexes où la programmation traditionnelle trouve ses limites. Construire un programme qui conduit une voiture serait très complexe voire impossible. Cela étant dû aux nombres infinis des cas possibles à traiter… ML traite cette problématique différemment. Au lieu de décrire quoi faire, le programme apprendra par lui même comment conduire en “observant” des expérimentations.

Machine Learning : Donner la possibilité à l’ordinateur d’apprendre sans être programmé.

En fonction des données d’expérimentation que prendra l’algorithme d’apprentissage en entrée, il déduira par lui même une hypothèse de fonctionnement.  Il utilisera cette dernière pour de nouveaux cas, et affinera son expérience au fil du temps.

Types de problèmes en Machine Learning

On distingue deux types de problèmes en ML :

  • Supervised Learning (Apprentissage Supervisé)
  • Unsupervised Learning (Apprentissage Non supervisé)

Supervised Learning

C’est le type le plus récurrent.  Il s’agit de fournir aux algorithmes d’apprentissages un jeu de données d’apprentissage (Training Set) sous forme de (X, Y) avec X les variables prédictives, et Y le résultat de l’observation. En se basant sur le Training Set, l’algorithme va trouver une fonction mathématique qui permet de transformer (au mieux) X vers Y. En d’autres termes, on l’algorithme va trouver une fonction F tel que : F(X) \approx Y

Un exemple:

En ayant un Training Set composé de plusieurs lignes ou chacune décrit les caractéristiques d’une voiture (variables prédictives) : comme le modèle, la couleur, nombre Km parcourus…. et le prix du véhicule (variable Y à prédire). je peux appliquer un algorithme supervisé pour définir une fonction de prédiction de prix d’une voiture. Cette fonction pourra être utilisée pour prédire le prix d’une voiture qui n’était pas dans le Training Set.

Unsupervised Learning

Dans ce type, on va donner à l’algorithme des données, éventuellement non structurées. Et on le laisse trouver une sorte de structure dans nos données. Cela peut être des regroupements de données (Clustering).

Un exemple :

En disposant des données d’achats des internautes dans un  site e-commerce, l’algorithme de clustering va trouver les produits qui se vendent le mieux ensemble.

 

Cet article est une première introduction au machine Learning. J’espère qu’il a attisé votre curiosité. Je n’ai fait qu’effleurer les concepts d’apprentissage supervisé et non supervisé mais je les détaillerai davantage dans les prochains articles.

Si vous avez des questions n’hésitez pas à les poser dans un commentaire. Et si l’article vous plait, n’oubliez pas de le partager ! 🙂

Inscrivez-vous à la Newsletter
Rejoignez la communauté Mr mint, le blog Français dédié à la Data Science et recevez des contenus exclusifs et d'autres goodies !
Nous détestons les spams. Votre adresse e-mail ne sera pas vendue ou partagée avec quelqu'un d'autre.
0 Flares Twitter 0 LinkedIn 0 Reddit 0 Google+ 0 Filament.io 0 Flares ×