L’Intelligence Artificielle (IA) redéfinit  bien des domaines. L’Interface Humain Machine (IHM) n’y échappe pas. Elle est même l’une des zones qui profite le plus spectaculairement des avancées considérables de l’IA. Une nouvelle étape dans la transformation technologique qui dessine de nouvelles frontières dans la relation entre humain et machine.

« N’apprenez plus à devenir une machine, Apple a inventé Macintosh ». Cette accroche n’est pas issue d’un des plus célèbres films de pub de la marque à la pomme réalisée par Ridley Scott en 1984. Elle était pourtant le signe annonciateur d’un rapport plus intuitif à la technologie. Le concept d’ordinateur personnel revisité par Apple, c’était la garantie d’une automatisation simplifiée, d’une facilitation de tous les instants et surtout d’une relation qui ne passait plus par l’exécution de codes mais par une interface graphique d’accès immédiat. L’humain commandait à la machine, celle-ci s’exécutait, avec la froide perfection de la résolution binaire. Voilà pour l’avenir. Tracé, immuable, incontestable. Oui, mais… Les problèmes sont devenus de plus en plus complexes, les exigences vis-à-vis des machines de plus en plus grandes, leurs capacités aussi, faisant de cette vision, pourtant novatrice à l’époque, le vestige d’un temps qui paraît désormais bien  loin.

Le dialogue, une évolution constante 

Avance rapide : une fin d’année 2022 où Chat GPT et les pas de géants de l’IA déchaînent les passions. En moins de 40 ans, la relation humain-machine a été totalement bouleversée. L’être humain ne doit peut-être plus « devenir une machine » mais, jusqu’ici, il devait savoir lui parler et l’écouter. Programmation, développement, à chaque domaine son langage, à chaque langage une expertise, un champ d’application. Un schéma simple, clair, précis… et caduc. Enfin, pas tout à fait. Mais force est de constater que la manière de demander l’exécution d’une tâche à Chat GPT diffère à l’évidence d’une ligne de code en Javascript.

Le langage est une modalité d’interaction qui évolue constamment, et celui qui régit désormais l’interface entre humain et machine se rapproche sensiblement d’une forme de langage naturel. De celui que l’humain utiliserait avec un autre humain en somme. Si l’utilité d’un tel progrès est évidente (démocratisation de l’interface humain-machine, automatisation des tâches les plus rébarbatives et concentration de la production humaine sur les tâches les plus intéressantes…), elle implique une adaptation phénoménale de l’ensemble des domaines où cette interaction se produit. En d’autres termes, presque partout, dans notre monde 2.0. Celui où nous n’aurions plus besoin d’apprendre à parler comme une machine car nous parlerions avec une machine qui a elle-même appris à parler comme un humain. Dans une situation où la porosité des frontières s’accélère de plus en plus, s’agit-il d’une machine humaine ou bien d’un humain machinisé en relation avec un être synthétique qui apparemment lui ressemble ? Une partie de la réponse à cette interrogation complexe réside peut-être dans l’émergence d’un nouveau métier tel que « Prompt engineer ». Cette nouvelle fonction, prisée par les entreprises, consiste à savoir comment parler à ces nouvelles machines pour qu’elles comprennent mieux ce qu’on leur demande et apportent ainsi des services plus aboutis. Finalement, ce qui est présenté comme un langage « naturel » ne l’est peut-être pas tant que ça parce que son usage nécessite une rhétorique à base technologique pour que le rapport soit optimisé. 

Derrière l’arbre se cache la forêt 

Nous n’en sommes qu’aux prémices des bouleversements induits par les développements de l’IA. Réalité virtuelle et augmentée, métavers, ces technologies encore balbutiantes vont peu à peu s’imposer dans nos vies, dans nos sociétés. Leur première caractéristique : fonctionner avec et grâce à un nombre considérable de données. Or, l’impact de la facilitation du dialogue humain-machine repose en grande partie sur la richesse des bases de données que la machine peut interroger pour y établir des corrélations afin de répondre à la question posée. A titre d’exemples, les chatbots et les serveurs vocaux existent depuis longtemps, et rares sont les utilisateurs qui n’y ont jamais été confrontés. Jusqu’ici, le dialogue était très limité, purement utilitaire, froid, pouvant aller jusqu’à prendre des tournures absurdes. C’est sûrement ici que l’amélioration de la compréhension de l’humain par la machine a le plus d’impact. En rendant la conversation avec un robot plus agréable, elle fait de ces solutions des outils bien plus efficaces. L’agrément de l’utilisation étant devenu un véritable critère de réussite, ce n’est pas rien. Mais ce n’est pas tout non plus, car derrière l’interface, c’est tout le système qui change. D’une solution définie et limitée, ces technologies d’interaction passent à une interrogation constante de multiples bases de données, elles-mêmes enrichies en permanence. Elles apportent donc à leur interlocuteur une réponse plus fournie et mieux adaptée.

Non seulement la machine comprend mieux la question posée, mais elle est également capable d’apprendre de chaque interaction et de progresser à chaque requête. Au fil de sa courbe d’apprentissage, elle se rapproche d’une limite qui, tel un horizon qui disparaît à mesure qu’on avance, est amenée à s’effacer. On a toujours considéré que l’ironie, l’humour, le contexte socioculturel, étaient des données impossibles à traiter de manière efficace et cohérente par la machine, mais pour combien de temps encore ? Les avancées considérables en matière d’interprétation des émotions par exemple tendent à relativiser ces limites que l’on pensait immuables.

Langage naturel, vraiment ? 

Finalement, la nouvelle frontière du langage homme-machine remplit presque toutes les cases d’un schéma de langage parfait. De celui de Roman Jakobson en l’occurrence. Un destinateur (l’humain), un destinataire (la machine), un message, un code, un contexte et un contact. Ce qui le différencie de toute autre forme de langage humain – humain, c’est le nombre de fonctions auquel il peut correspondre. Là où le dialogue humain – humain peut remplir 6 fonctions, la machine est pour le moment incapable de proposer une véritable réciprocité et se prive donc, toujours selon Jakobson,  de 3 fonctions essentielles du langage : ll’expressive, la conative et la poétique.

Charge à l’humain de définir les modalités d’interaction à développer avec la machine. Tant que celle-ci sera considérée comme un outil, le dialogue n’en sera pas vraiment un, et l’interaction restera strictement utilitaire. Le langage est pourtant bien plus que cela. Le langage naturel, c’est entre autres l’improvisation, l’adaptation, l’erreur, le balbutiement, le ton, la pause, l’ouverture à l’autre, la réciprocité, la compassion, l’empathie. Le langage utilitaire, quant à lui, est une modalité d’accès à de l’information, un schéma binaire : question – réponse. Or, l’être humain n’a plus besoin de devenir une machine, disait Apple…

De plus en plus de recherches, issus de domaines variés (philosophie, linguistique, histoire, sciences sociales, sciences politiques…) s’emparent d’ailleurs du sujet. Elles font du dialogue humain-machine une thématique holistique. Qu’est-ce que la compréhension réelle de l’humain ? Où se situe la nouvelle frontière entre la compréhension et l’interprétation ? Et celle qui sépare, de ce fait, l’humain de la machine ? Qui de l’homme ou de la machine se rapproche en réalité plus de l’autre ? Apple avait sans doute raison : 1984 n’a pas tout à fait été comme le 1984 imaginé par George Orwell. Quid de 2024 ?  

Article initialement paru dans Forbes.