Les compréhenseurs de données créatifs

Le spin-off SpinningBytes de l'ETH programme des logiciels qui, gr?ce à l'apprentissage automatique, peuvent non seulement analyser, mais aussi comprendre d'énormes quantités de données. Cela permet de développer des solutions sur mesure pour de nombreux problèmes informatiques, mais aussi d'acquérir de nouvelles connaissances à partir de données jusqu'ici inexploitées.

Vue agrandie : nuage de mots
Gr?ce au Machine Learning, le logiciel peut créer ce que l'on appelle des nuages de mots et visualise ainsi les liens entre les mots dans les tweets par exemple. (Image : SpinningBytes)

Tout a commencé il y a quelques années : Mark Cieliebak, Martin Jaggi et Fatih Uzdilli faisaient de la recherche à l'ETH et à la ZHAW dans le domaine de l'informatique et publiaient leurs technologies dans des articles scientifiques. Mais cela ne leur a pas permis d'acquérir une grande notoriété. Les trois informaticiens ont voulu changer cela : c'est ainsi qu'ils ont fondé en 2015 le spin-off de l'ETH SpinningBytes et ont mis les programmes gratuitement à disposition sur leur site Internet.

Aujourd'hui, le spin-off propose non seulement des solutions technologiques prêtes à l'emploi, mais aussi et surtout la programmation de logiciels de data science en fonction des projets. "Nous développons des programmes qui permettent d'analyser et, dans une certaine mesure, de comprendre les données", explique le CEO Cieliebak à propos de cette offre spéciale. Pour pouvoir construire de tels logiciels, le spin-off a besoin de données sur lesquelles le programme peut s'appuyer et à partir desquelles il peut apprendre : "Notre logiciel examine les données existantes, établit des statistiques sur certaines régularités et génère de nouvelles connaissances à partir desquelles il agit ensuite".

Analyser et classer les articles

Un exemple est le classement et la catégorisation d'énormes quantités de textes. C'est par exemple le cas du logiciel que SpinningBytes a programmé pour les Archives économiques suisses. Depuis 1890, les archives rassemblent des rapports sur l'économie suisse, qui sont tous catégorisés selon le même modèle. Auparavant, les archivistes examinaient chaque texte, mais le programme peut désormais se charger de cette partie du travail. Pour cela, le logiciel a analysé 30 000 articles déjà catégorisés et a appris les règles d'attribution.

Service client numérique

Les informaticiens de SpinningBytes ne s'occupent toutefois pas uniquement de textes écrits. Ils développent également des programmes capables de reconna?tre et de comprendre la voix humaine - et de donner une réponse. "C'est justement dans le service à la clientèle qu'il existe un énorme potentiel pour de tels systèmes de dialogue", estime Cieliebak, "car les mêmes dialogues sont très souvent menés sur une hotline de service". Les conversations qui se déroulent souvent de manière similaire peuvent être "automatisées" gr?ce au Machine Learning. Ainsi, à l'avenir, une caisse-maladie pourrait par exemple traiter le premier Contact standardisé avec des clients potentiels au moyen d'un formulaire numérique. "Mais le logiciel ne remplace pas un être humain", assure Cieliebak. En effet, dès que la conversation s'écarte trop des phrases standard introduites, le logiciel ne peut plus se baser sur les réponses saisies auparavant et doit renvoyer à un collaborateur du service clientèle.

Calculer le risque d'infarctus du myocarde gr?ce à Twitter

Il est également possible d'établir des prévisions sur la base de l'analyse d'énormes quantités de données : Dans un nouveau projet, un programme de SpinningBytes étudie le risque d'infarctus du myocarde dans différentes régions à partir de tweets. Comment cela fonctionne-t-il ? " Un infarctus du myocarde est notamment lié au fait d'être heureux ou non ", explique Cieliebak, qui poursuit : " Le langage utilisé dans les tweets permet de tirer des conclusions sur le degré de satisfaction, et en le combinant avec d'autres données statistiques, il est possible de tirer des conclusions sur le risque d'infarctus dans une région donnée." D'autres programmes de prévision de ce type sont actuellement en cours de planification.

SpinningBytes au salon Scientifica 2017

Cet article a-t-il éveillé votre intérêt ? Au salon Scientifica, vous en saurez plus sur ce qu'il faut pour que les ordinateurs comprennent quelles informations sont contenues dans un texte et ce que le texte signifie. Visitez SpinningBytes à l'exposition le page externeStand T16 "Langage naturel et intelligence artificielle". et découvrez l'état d'avancement de la recherche dans ce domaine.

Lors de Scientifica, vous pouvez rencontrer de nombreux autres scientifiques et leur poser vos questions le

  • Vendredi 1er septembre 2017, 18h - 21h (vernissage)
  • Samedi 2 septembre 2017, 13h - 19h
  • Dimanche 3 septembre 2017, 11h - 17h
JavaScript a été désactivé sur votre navigateur.