> Tech > Watson, l’IA qui a surpassé l’esprit humain

Watson, l’IA qui a surpassé l’esprit humain

Tech - Par Renaud ROSSET - Publié le 21 mars 2011
email

Le jeu est une véritable institution aux Etats-Unis. Depuis 1964, Jeopardy a vu défiler des milliers de candidats. Et cette année, deux des meilleurs ont été vaincus par une machine.

Après avoir mis en échec Garry Kasparov en 1997 avec Deep Blue, IBM vient à bout des champions du Jeopardy à grands coups de Teraflops.

Watson, l’IA qui a surpassé l’esprit humain

Quatre ans de recherche ont été nécessaires pour aboutir à cette prouesse et à la création de l’architecture logicielle DeepQA. Une grappe de 90 serveurs IBM équipés de processeurs POWER7 est à la base de Watson, nom donné à l’ordinateur chargé d’affronter Ken Jennings et Brad Rutter, en hommage au fondateur d’IBM Thomas Watson.

Rappelons le principe de Jeopardy. Dans ce jeu télévisé, les trois candidats doivent trouver la question à la réponse qui leur est donnée. Histoire, littérature, politique, science, sport, géographie, les domaines couverts sont très variés et les réponses fournies aux candidats contiennent des ambiguïtés, des sous-entendus, de l’ironie, des jeux de mots ou des énigmes.

Pour déjouer les subtilités de langage, les équipes d’IBM ont dû mettre en place un système de traitement automatique intégrant plus d’une centaine de techniques d’analyse du langage naturel : Natural language processing, Information retrieval (recherche d’informations), Machine learning (apprentissage machine), traitements linguistiques, représentation du savoir, techniques de raisonnement, … Ce n’est pas par hasard si un des concepteurs, Leslie Valian, a récemment reçu le prestigieux prix Turing, équivalent d’un prix Nobel informatique.

Les candidats ne peuvent actionner le bumper pour répondre qu’une fois que le présentateur a prononcé le dernier mot de la question. Watson, lui, reçoit l’information sous forme de texte électronique, également envoyé une fois la question entièrement posée.

« Pour être au niveau des meilleurs champions, Watson devait pouvoir répondre à au moins 70 % des questions posées avec une précision supérieure à 80 % et le tout en 3 secondes maximum », explique Olivier Davoust, responsable produit Power Systems en France. Pour obtenir de tels résultats sans être connecté à internet, l’intelligence artificielle a dû emmagasiner 200 millions de pages en langage naturel, soit l’équivalent d’un million de livres.

Quel avenir pour Watson ?

Une fois le jeu remporté, reste à savoir quoi faire du système. Si Deep Blue était inutilisable commercialement en raison de ses 400 puces spécifiques au jeu d’échec, Watson peut rendre de nombreux services, d’autant qu’il s’appuie sur des logiciels et matériels disponibles dans le commerce.

IBM a déjà proposé à certains de ses clients aux Etats-Unis de mettre Watson à l’épreuve dans leur secteur d’activité. Un médecin de l’université de Columbia a été le premier à pouvoir le tester sur un cas médical complexe. Une fois intégrées les informations sur le patient en question, la machine a établi en quelques minutes un diagnostic que le médecin avait mis quatre mois à définir.

« Le but n’est pas de substituer la machine au médecin dans l’établissement d’un diagnostic mais elle peut faire le tri dans la base d’informations à laquelle le médecin aurait habituellement recours », explique Sandra Calabre, directrice des ventes Power Systems.

« L’idée est de l’utiliser pour tous les métiers qui demandent de recourir à une masse d’informations en langage naturel, comme c’est le cas par exemple pour la Justice dans la recherche de jurisprudences », complète Olivier Davoust. « De plus en plus d’entreprises ont ponctuellement besoin de puissances de calculs importantes. Avec un processeur actuel puissant, Watson met deux heures à répondre à une seule question. C’est pour cela que les offres Cloud se mettent en place. »

Prochaine étape pour Watson, sur laquelle planchent déjà les chercheurs, la compréhension vocale.

Carte d’Identité Complète

Les logiciels IBM utilisés :

• IBM Contents Analytics : LanguageWare tokeniser
• IBM Research : parser ESG
• IBM Java for Power Systems
• IBM DB2 : stockage des logs pour l’analyse des erreurs
• Rational : développement du code

Les logiciels libres :

• Système d’exploitation SUSE Linux Enterprise Server SLES 11
• Framework de développement Eclipse
• Framework de description et analyse de contenu Apache UIMA
• Framework de parallélisation Apache Hadoop (algorithme MapReduce)

Le matériel utilisé :

Cluster de 90 serveurs IBM Power 750
• 60 nœuds avec 128 Go RAM
• 30 nœuds avec 256 Go RAM
• 15 To de RAM au total
• Réseau interconnexion Ethernet 10 GbE
• 20 To de stockage disques en cluster
• 10 racks, avec environ 10 noeuds par rack, le 10e contenant switch réseau, nœuds contrôleur et stockage sur disques

Chaque nœud contient 4 chips Atlas POWER7 cadencé à 3,55 GHz ; chaque chip a 8 coeurs (CPU).
Soit au total 2 880 cœurs POWER7 pour le système Watson.

500 Go/s de bande passante on-chip.

Puissance de calcul de 80 Teraflops par seconde (80 mille milliards d’opérations par seconde).

Téléchargez cette ressource

Sécuriser votre système d’impression

Sécuriser votre système d’impression

Longtemps sous-estimée, la sécurisation d’un système d’impression d’entreprise doit être pleinement prise en compte afin de limiter le risque de fuite d’informations sensibles. Voici les 3 principales précautions à prendre.

Tech - Par Renaud ROSSET - Publié le 21 mars 2011