La maîtrise des environnements informationnels


Jacqueline Sala de VeilleMag et Véronique Mesguish de l’ADBS ont organisé vendredi 4 Mars au Pôle Léonard de Vinci l’évènement « Search 2011 » .

clip_image002 Parmi les nombreuses conférences et ateliers proposés j’ai suivi celle intitulée : La maîtrise des environnements informationnels, d’une durée de 45 mn. L’intervenant Adi El Ghali, chercheur IBM France, nous a parlé des projets de cloud computing d’IBM, plus particulièrement des problématiques liées à leur interconnexion avec d’autres environnements et à leur questionnement.

En effet, aujourd’hui, les acteurs de la Recherche et Développement sont amenés à intégrer de nouvelles composantes informationnelles. Or les solutions existantes ne permettent pas de passer certains caps critiques (millions à milliards de lignes, milliers à centaines de milliers de critères). De plus les nouveaux modes d’organisations, plus transversaux, demandent aux différentes composantes de l’entreprise de mettre en place plus de partenariats et d’associations avec de nouveaux partenaires comme les fournisseurs ou les clients.

Etre capable d’avoir la maîtrise de l’ensemble de son écosystème informationnel est un enjeu majeur pour une entreprise. Un projet de R&D devient un enjeu déterminant pour favoriser l’innovation tout en préservant la compétitivité.

En utilisant l’exemple du Jeu Jeopardy, Adi El Ghali a démontré toute la complexité de la démarche. (Une version francisée du jeu pourrait être comparée à « Questions pour un Champion”).

clip_image004

Le principe de l’émission, le présentateur pose des questions de culture générale sur des thèmes diverses (Géopolitique, sciences, loisirs, sports….) A chaque bonne réponse, les joueurs empochent des gains. Des bonus et des malus permettent de modifier la donne en fonction des bonnes ou mauvaises réponses apportées même partiellement.

Pendant deux jours (d’enregistrements), 2 grands gagnants se sont battus avec un autre concurrent « Watson ».

Au préalable, les archives de l’émission ont été traitées manuellement puis informatiquement par des équipes de chercheurs afin d’obtenir des tableaux structurés. Dans un second temps des outils de traitement des langues ont été développé pour que l’application puisse décortiquer la question et apporter une réponse dans les temps impartis du jeu.

Le jeu Jeopardy constitue un défi puisque les indices du jeu impliquent d’analyser le sens subtil des mots, l’ironie, les devinettes et bien d’autres complexités dans lesquelles l’être humain excelle alors que l’ordinateur est traditionnellement dépassé.

Les conclusions de l’expériences n’ont pu être complètement développées pour des questions de temps et de confidentialité. Abi a pu cependant nous confier que jusqu’en 2007, la tendance générale donnait toujours l’avantage à l’Humain pour les très bons candidats (80% de bonnes réponses) et 20% pour la machine. Après…. Cela entre sous le sceau de la confidentialité.

A côté de cet exemple, ce projet à donné un éclairage nouveau sur les problématiques liées au traitement de l’information.

Le premier relève déjà du stockage de l’information. Un premier constat, les solutions actuelles ne permettent pas d’espérer d’amélioration. Nous sommes a un point de rupture technologique, les langages utilisés comme le SQL ne permettent pas de gérer des milliards de lignes et des milliards de champs, d’intégrer des données non structurées pour les structurer.

De nouveaux outils et de nouvelles méthodologies, dérivant de différentes sciences (traitement des langues, sociologie) dans la conception des nouvelles solutions informatique sont appelées a se développer.

C’est ce que propose IBM avec sa technologie "behind Watson".

Le caractère innovant de Watson, qui tire son nom du Fondateur d’IBM Thomas J. Watson est de construire un système informatique qui rivalise avec la capacité humaine à répondre à des questions posées dans un langage naturel, tout cela avec vitesse, précision et confiance en soi.

La formulation du questionnement et l’interrogation des bases de données.

Le langage naturel est très riche, la formulation du questionnement fait l’objet d’un champ de de recherche à lui tout seul. Le projet Watson traite essentiellement de l’anglais. Dans une moindre mesure, il prend en compte d’’autres langues comme, le Chinois, le japonais ou le français.

Sujet – Verbe – Predicat

clip_image006

Le traitement en langage naturel des informations est un double défi, un défi pour ingénieurs qui devront programmer les ordinateurs et créer des interfaces Hommes-Machines accessibles mais aussi un défi pour les organisations humaines. Comment intégrer et diffuser au sein des entreprises ce qui relève aujourd’hui du domaine de la recherche linguistique.

Comment faire comprendre aux entreprises que maîtriser la modélisation du langage naturel doit être considérée comme une compétence et non relever de l’innée afin de créer des requêtes puissantes et obtenir des résultats qualifiés dans des délais raisonnables.

Conclusion : IBM porte beaucoup d’espoir dans ces développements, deux idées reçues doivent être battues en brèche. Les digitals natives n’acquièrent pas à la naissance des compétences particulières, ils ont peut être une capacité à adopter de nouveaux usages, mais ils n’ont pas à la naissance de compréhension particulière sur l’utilisation avancée des nouveaux domaines de compétences. La Googlisation des Esprits. Google par son système de requêtage ne permet pas d’acquérir dans son utilisation grand public de compétences transposables dans une utilisation avancée des outils développés par IBM.

 

http://www.IBMWatson.com

Vous pouvez voir la vidéo :

http://www.youtube.com/ibm#p/c/4F1C783776E708A8/0/FC3IryWr4c8

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s