Une nouvelle intelligence artificielle : moins de données, plus de probabilité

De Daniela Castro dans Technique

26 mai 2017

L’APPRENTISSAGE AVEC MOINS DES DONNÉES

Crédits d’image: Forbes 

https://www.forbes.fr/technologie/top-10-des-technologies-de-lintelligence-artificielle-ia/#

Le proverbe “c’est en forgeant qu’on devient forgeron” s’applique désormais aux machines, car beaucoup de dispositifs d’intelligence artificielle dépendent aujourd’hui de la répétition pour apprendre. Les algorithmes d’apprentissage approfondi (deep learning) sont conçus pour permettre aux périphériques d’intelligence artificielle de recueillir des connaissances à partir de jeux de données et ensuite d’appliquer ce qu’ils ont appris à des situations concrètes. Par exemple, un système d’intelligence artificielle reçoit des données sur la façon dont le ciel est généralement bleu, ce qui lui permet de reconnaître plus tard le ciel dans une série d’images.

Donc, pour qu’un algorithme d’apprentissage approfondi puisse reconnaître un chat avec le niveau de précision d’un chat sibérien, on doit le “nourrir” avec des centaines de milliers d’images de félins, avec des variations de taille, de forme, de texture, d’éclairage et d’orientation. Ce travail complexe peut être accompli en utilisant cette méthode, mais les mêmes résultats ne pourraient-ils pas être obtenus en lui fournissant moins de données ? Il serait beaucoup plus efficace si, un peu comme une personne, un algorithme pouvait développer une idée de ce qui rend un chat basique un chat sibérien.

Une startup basée à Boston, Gamalon, a développé une nouvelle technologie pour tenter de répondre à cela et elle a publié deux produits qui utilisent sa nouvelle approche. Ce type de technologie permet à une machine d’apprendre efficacement à partir de moins de jeux données et d’affiner ses connaissances.

Gamalon utilise une technique appelée “le programme de synthèse bayésien” pour créer des algorithmes capables d’apprendre à partir de moins de données. La probabilité bayésienne, nommée d’après le mathématicien Thomas Bayes du 18ème siècle, fournit un cadre mathématique pour affiner les prédictions sur le monde en fonction de l’expérience. Le système de Gamalon utilise une programmation probabiliste – ou un code qui traite des probabilités plutôt que des variables spécifiques – pour construire un modèle prédictif qui explique un ensemble de données particulier. À partir de quelques exemples, un programme probabiliste peut déterminer, par exemple, qu’il est très probable que les chats aient des oreilles, des moustaches et des queues. À mesure que d’autres exemples sont fournis, le code peut être réécrit pour modifier les probabilités. Cela fournit un moyen efficace d’apprendre les connaissances importantes des données. Cette forme de programmation probabiliste pourrait être appliquée à tout, de l’apprentissage d’un smartphone pour reconnaître les préférences de son utilisateur jusqu’aux systèmes de conduite autonomes pour identifier rapidement les obstacles.

Si la technique sous-jacente peut être appliquée à de nombreuses autres tâches, cela pourrait avoir un impact important. La capacité d’apprendre à partir de moins de données pourrait permettre aux robots d’explorer et de comprendre de nouveaux environnements très rapidement ou de permettre aux ordinateurs de connaître les préférences de l’utilisateur sans partager leurs données.

 

PROGRAMMATION PROBABILISTIQUE

Les techniques de programmation probabilistes ont été en phase d’étude pendant un certain temps. En 2015, par exemple, une équipe de MIT et NYU, dirigé par Brendan Lake (chercheur de la NYU), a travaillé sur une technique de programmation probabiliste pour que les ordinateurs apprennent à reconnaître des caractères écrits et des objets après avoir vu un seul exemple.

Bien que cette nouvelle approche de la programmation rencontre toujours des défis difficiles à surmonter, elle a un potentiel important puisqu’elle peut automatiser les aspects du développement d’un modèle d’apprentissage par machine. La programmation probabiliste rendra l’apprentissage en machine beaucoup plus facile pour les chercheurs et les développeurs, car “il est possible de gérer des morceaux difficiles [de programmation] automatiquement” explique Lake.

L’apprentissage par machine implique actuellement l’acquisition d’un grand ensemble de données brutes, et souvent une identification manuelle. L’apprentissage se fait alors dans de grands centres de données, en utilisant de nombreux processeurs en parallèle. “Il n’y a que quelques entreprises vraiment grandes qui peuvent vraiment se permettre de le faire”, indique Ben Vigoda, cofondateur et PDG de Gamalon.

L’approche de Gamalon pourrait rendre beaucoup plus facile pour quelqu’un la construction et l’affinage d’un modèle d’apprentissage par machine. Le perfectionnement d’un algorithme d’apprentissage approfondi nécessite une grande expertise en mathématiques et en apprentissage par machine. Cependant avec l’approche de Gamalon, il serait plus facile former un modèle en se servant d’exemples significatifs.

Ben Vigoda a montré à la MIT Technology Review une démo avec une application de dessin qui utilise leur nouvelle méthode. Il est semblable à celui publié l’année dernière par Google, qui utilise l’apprentissage approfondi pour reconnaître l’objet qu’une personne essaye d’esquisser. Mais alors que l’application de Google doit voir un dessin correspondant à ceux qu’elle a déjà vu précédemment, la version de Gamalon utilise un programme probabiliste pour reconnaître les caractéristiques clés d’un objet. Par exemple, l’application comprends qu’un triangle assis sur un carré est probablement une maison. Cela signifie que même si le dessin est très différent de ce qu’elle avait vu précédemment, à condition qu’elle dispose de ces caractéristiques clés, l’application fera une prédiction correcte.


Crédits d’image: Gamalon https://gamalon.com/technology/

Les premiers produits proposés par Gamalon montrent que cette technique pourrait également avoir une utilisation commerciale à court terme, en utilisant le programme de synthèse bayésien pour reconnaître les concepts dans un texte. Le produit, “The Gamalon Structure”, utilise le programme de synthèse bayésien pour reconnaître les concepts à partir du texte brut, et il le fait plus efficacement. Par exemple, après avoir seulement reçu une description du fabricant d’un téléviseur, elle peut déterminer sa marque, son nom de produit, sa résolution d’écran, sa taille et d’autres caractéristiques. Aussi, une autre application, appelée “Gamalon Match”, classe les produits et les prix dans l’inventaire d’un magasin. Dans chaque cas, même si différents acronymes ou abréviations sont utilisés pour un produit ou une caractéristique, le système peut rapidement être formé pour les reconnaître.

 

La capacité d’apprendre d’une machine avec le programme de synthèse bayésien aura donc des avantages multiples. Un ordinateur ou smartphone pourrait en apprendre davantage sur les intérêts d’un utilisateur sans exiger une quantité énorme de données ou heures de d’apprentissage. De plus, les données personnelles pourraient ne pas être partagées avec les grandes entreprise. Les robots ou les voitures autonomes pourraient aussi apprendre à s’adapter à leur environnement beaucoup plus rapidement en utilisant cette méthode d’apprentissage.

 

BIBLIOGRAPHIE: 

- When Machines Have Ideas | Ben Vigoda | TEDxBoston: https://www.youtube.com/watch?v=PCs3vsoMZfY

- Gamalon: https://gamalon.com/technology/

- ILP – MIT: http://ilp.mit.edu/newsstory.jsp?id=22979

- Forbes: https://www.forbes.com/sites/aarontilley/2017/02/14/gamalon-artificial-intelligence-bayesian/#6af849e963c7

- Bloomberg BusinessWeek: https://www.bloomberg.com/news/articles/2017-02-14/here-s-why-this-cat-spotting-ai-is-different

- TechCrunch: https://techcrunch.com/2017/02/14/gamalon-leverages-the-work-of-an-18th-century-reverend-to-organize-unstructured-enterprise-data/

- MIT Technology Review: https://www.technologyreview.com/s/603542/ai-software-juggles-probabilities-to-learn-from-less-data/

- Digital Journal: http://www.digitaljournal.com/tech-and-science/technology/ai-software-learns-to-write-its-own-code/article/485847

- Digital Trends: https://www.digitaltrends.com/computing/gamalon-machine-learning-bps-technology/

- Engadget: https://www.engadget.com/2017/02/14/gamalon-fast-machine-learning/

- Tech Xplore: https://techxplore.com/news/2017-02-gamalon-technology-machine.html

- EE Times: http://www.eetimes.com/document.asp?_mc=RSS_EET_EDT&doc_id=1331346&page_number=1

 

Commentaire

4 × = vingt huit

iMDEO recrute !

REJOIGNEZ-NOUS

A la recherche de nouveaux talents (développeurs web et mobile, chefs de projet,...)

Voir les annonces