La révoluSON industrielle, définie comme la place progressivement prise par l’audio dans la société en raison d’une combinaison simultanée de facteurs sociétaux, technologiques et économiques, illustre une vieille volonté humaine de mimétisme. Bien avant l’invention du traitement électronique du signal, les chercheurs ont en effet essayé de construire des machines recréant la parole humaine :
1791 : considérée comme l’ancêtre de l’audio-augmentation Text-to-Speech (TTS), la Speaking Machine est inventée par Wolfgang von Kempelen, ingénieur au service de l’impératrice Marie-Thérèse d’Autriche ;
1950 : le test de Turing est formulé par le scientifique britannique A.M. Turing dans une publication, intitulée « Computing Machinery and Intelligence », jetant les bases de ce qui allait devenir l’informatique. Enjeu du test : ne pas réussir à faire la différence entre le comportement de l’homme et de la machine ;
2019 : le C.F.O. d’une entreprise britannique du secteur de l’énergie reçoit oralement et exécute immédiatement une demande de virement de 220 000 € émanant apparemment du patron de sa maison mère en Allemagne, dont la voix avait visiblement été imitée par une voix de synthèse ;
2023 : le 16 février, la journaliste Sonia Mabrouk interviewe ChatGpt sur Europe 1, en utilisant les voix de synthèses etx majelan.

Nous entrons donc dans ce que je propose d’appeler la « société de la vraisemblance » que nous pourrions définir de la façon suivante : société marquée par la vraisemblance de l’IA et son rôle croissant, rendu possible par les évolutions technologiques du début des années 2000 et posant la question des règles éthiques applicables afin d’éviter les dérives de l’usage liées à la vraisemblance de l’IA.

Avec l’IA, nous entrons dans la « société de la vraisemblance »
Alors que la fatigue digitale, notamment liée à l’explosion de la vidéo, a fait l’objet de nombreuses recherches, la crise de la Covid-19 s’est traduite par l’accélération de trois évolutions latentes, favorables à la révoluSON industrielle et à l’avènement de la société de la vraisemblance :
Le télétravail, désormais considéré comme un acquis pour nombre de parties prenantes, il favorise l’écoute de contenus audio, personnels ou professionnels ;
L’évolution de la mobilité, avec un point commun à tous ses changements : les études (Nova Consulting de mars 2022) font apparaître un sentiment de perte de temps dans les transports et la volonté de faire de chaque trajet l’opportunité d’apprendre, de s’informer ou de travailler. Autant de facteurs favorables à l’audio, l’ouïe étant le seul sens compatible avec cette volonté ;
Le besoin de frugalité digitale, tant en termes de fatigue personnelle que de responsabilité collective, ce qui est justement l’une des caractéristiques de l’audio, qui consomme environ quatre fois moins de bande passante que la vidéo, d’après une étude Arcep – Arcom de janvier 2022. 

Opportunités et risques de cette « société de la vraisemblance »
La révoluSON industrielle peut être séparée en deux parties bien distinctes, avec premièrement une révoluSON dite personnelle, axée majoritairement sur trois points :
Information : l’audio-augmentation des contenus écrits constitue un changement de paradigme, avec la perspective de pouvoir écouter les contenus au lieu de les lire. En Occident, cette révoluSON industrielle est un levier stratégique d’accessibilité pour mieux toucher les publics fragiles, les jeunes ou les dirigeants. Dans les pays en voie de développement, elle est une opportunité majeure pour favoriser l’accès à l’information ;
Formation : les supports écrits représenteraient environ 85 % des supports de cours dans les grandes écoles, et leur audio-augmentation constituerait un facteur accru d’accessibilité ;
Culture : avec le saut qualitatif réalisé par la TTS, va s’ouvrir un vaste potentiel de diffusion de l’usage.

D’un autre côté, alors qu’un particulier passe, en moyenne, cinq ans de sa vie dans son véhicule, on estime qu’un professionnel y passe, en moyenne, quinze ans (source : PFA). Ce temps passé constitue donc un enjeu majeur pour partager des contenus avec le seul sens disponible et autorisé, l’ouïe. Cette révoluSON professionnelle s’organise autour des trois axes suivants :
Mieux se former : que ce soit pour de la formation aux derniers produits, de la sécurité ou à l’éthique, grâce à des versions audios-augmentées des documents écrits existants aujourd’hui ;
Mieux s’informer : qu’il s’agisse d’informations données par une publication professionnelle, un syndicat ou un fournisseur sur une innovation produit, chaque trajet sera l’occasion d’écouter l’information récupérée via du scrapping ou une API et audio-augmentée, le tout en 100 langues et accents, puisque la TTST permet d’inclure des traducteurs automatiques ;
Mieux manager : avec le développement du télétravail, l’inspiration managériale est aujourd’hui une vraie difficulté que la révoluSON industrielle peut partiellement contribuer à résoudre en mettant à disposition des contenus audio motivants ou récréatifs, comme la version audio du quotidien sportif ou régional préféré du collaborateur.

La société de la vraisemblance est encore difficile à évaluer économiquement avec précision, mais un consensus émerge sur l’importance du changement de paradigme en cours, illustrable à plusieurs niveaux :
Par la montée en puissance du « Voice Search Optimisation », dont l’objectif est de permettre aux contenus de remonter dans les moteurs de recherche, à commencer par celui de Google ;
Par l’évaluation du marché de l’audio-augmentation TTS (cf. Morgan Stanley) à 20 milliards d’euros en 2030 pour ses usages directs ;
Par le fait que la révoluSON industrielle représentera probablement une part très significative des contenus (source : etx majelan et Continental) disponibles en 2030 sur le marché de l’expérience en mobilité, évalué à 40 milliards d’euros ;
Par la très forte croissance prévue du nombre d’assistants vocaux ;
Par la très forte croissance de la monétisation de l’audio digital, qui représente aujourd’hui seulement 1 % du marché publicitaire mondial, mais qui réalise actuellement 50 % de croissance par an.

Rendue possible par la révoluSON industrielle, porteuse de nombreux espoirs, la société de la vraisemblance comporte aussi de sérieux risques éthiques qu’il convient de prévenir :
Le risque d’usurpation est bien entendu le premier risque identifié, la qualité des voix de synthèse étant désormais de plus en plus proche de la perfection et totalement personnalisable ;
Le risque de confusion psychologique personnel ;
Le risque « d’anthropomorphisation » collective.

Projetons-nous en 2030
Nous serons dans la « société de la vraisemblance ».
La presse quotidienne s’écoutera sur son téléphone, avec possibilité d’écouter L’Équipe ou Le Figaro en 100 langues et accents, pouvant même reproduire fidèlement les voix des grandes plumes de ces maisons. Jaguar Land Rover, Stellantis ou Renault auront mis l’autoradio du futur au cœur de leur expérience à bord. Le Sénat, les sites du gouvernement français ou de la Commission européenne, seront massivement audio-augmentés. Les notices d’utilisation des médicaments s’écouteront, les étiquettes des vêtements du Printemps à Paris ou du Bund à Shangaï, aussi.
La France, espérons-le, sera stratégiquement, économiquement et éthiquement le pays phare de cette « société de la vraisemblance ».
Cocorico 😄

Jérôme Doncieux
fondateur & Ceo d’etx majelan, et diplômé de l’Executive Master de l’Ecole Polytechnique de Paris

Lire l’article complet sur : www.influencia.net