Pyannote, la reconnaissance vocale open source

Lancée il y a six semaines, la start-up PyannoteAI développe des modèles d’intelligence artificielle vocale. Objectif : réussir la « diarisation », à savoir, déterminer automatiquement qui parle et quand ? dans un enregistrement audio ou vidéo.
« Le modèle s’attache au son, au timbre de la voix et non pas à la langue. Nous avons des utilisateurs allemands, américains, russes, indiens… » précise Vincent Molina, le cofondateur.
Issue des recherches du CNRS , la technologie est disponible librement. « Ma mission était de diffuser la savoir. J’avais tout mis dans une bibliothèque open source. Des milliers d’entreprises utilisaient mes travaux de recherche », précise Hervé Bredin, cofondateur de la société et chercheur au CNRS. L’outil est disponible en freemium, avec un abonnement pour les cas d’usage professionnels.
La start-up pourrait cibler les marchés de la transcription, de l’audiovisuel ou du secteur de la santé, notamment dans les consultations médecin-patient, dans un environ fermé, grâce à une API ou en local. A VivaTech, la start-up a remporté le « Deeptech Challenge Pitch Contest ».

Stellia, l’assistant qui enseigne
Stellia. AI développe un « assistant de connaissance » personnalisé grâce à l’intelligence artificielle générative, utilisant les LLM (grands modèles de langage), en particulier dans le domaine de l’éducation. La start-up de 25 employés contractualise avec l’enseignement supérieur, comme le Centre national d’enseignement à distance et des universités américaines.
Pour faciliter son déploiement, elle cherche à se diversifier. « L’objectif est de développer la partie privée, en particulier les grands groupes et leurs salariés. Ensuite, nous continuons de développer la tech pour aller vers plus de personnalisation et prendre en compte le profil de chaque utilisateur », confie Samy Lahbabi, le cofondateur de la start-up, incubée à l’Ecole polytechnique. La start-up a levé 4 millions d’euros en 2022 auprès des fonds Innovacom et Inco Ventures.

NcodiN, le composant derrière l’IA
L’intelligence artificielle connaît un essor spectaculaire et est favorisée par le développement de microprocesseurs de plus en plus puissants. « Or, la limite qui bloque la scalabilité de la circulation de l’information dans les microprocesseurs, c’est le cuivre », rappelle Francesco Manegatti, le patron de NcodiN, une start-up qui s’appuie sur les travaux de recherche qu’il a menés au Centre de nanosciences et de nanotechnologies (C2N).
NcodIn entend briser ce « mur du cuivre » en développant des composants reposant sur une technologie d’interconnexion optique. La promesse ? Permettre une transmission de données à haute vitesse et de façon plus sobre.
Les prototypes de NcodiN sont fabriqués dans la salle blanche du C2N. « C’est un avantage unique puisque cela nous permet de fabriquer une puce en trois semaines et donc d’accélérer notre R&D. Cela aide aussi à développer des preuves de concept pour les clients », rembobine le dirigeant, qui espère vendre ses produits à des sociétés comme Intel, Nvidia, Qualcomm ou AMD.

Biped, l’IA au service du handicap
Bruno Vollmer et Maël Fabien ont créé en 2020 Biped.ia, une start-up qui propose un harnais porté sur les épaules pour accompagner les personnes malvoyantes et aveugles lors de leurs déplacements. Equipé de trois caméras grand-angle et infrarouges, l’appareil permet d’avoir une vision à 70° et d’être utilisé la nuit.
Le harnais peut se connecter à des écouteurs ou à un casque afin d’avertir l’utilisateur des obstacles avec des sons spatiaux. Grâce à des algorithmes d’IA, cet appareil de moins d’un kilo décrit l’environnement. Il permet d’identifier des obstacles à plus de cinq mètres de distance, placés au niveau de la tête (branche, panneau de signalisation, etc.), au niveau du sol (trous, pierres, etc.) et les obstacles latéraux.
Après deux ans de R&D, Biped.ia est entrée en phase de commercialisation, dans un premier temps avec 50 unités. L’objectif sur l’année est de 200 unités, vendues au prix de 4.300 euros. L’entreprise installée à Lausanne, en Suisse, a déjà levé 2,6 millions d’euros.

Lipitt, l’outil pour doubler les vidéos
La traduction est un secteur secoué par la révolution de l’intelligence artificielle. La preuve avec la jeune pousse allemande DeepL , qui vient de lever 300 millions de dollars sur une valorisation de 5 milliards de dollars. En France, cela bouge aussi. Créée en juillet 2023, Lipitt est une solution de traduction consacrée à la vidéo.
Dans le détail, la jeune pousse a développé une plateforme qui, en un clic, permet de traduire des vidéos avec des sous-titres. La start-up, qui travaille notamment avec Gladia, fait aussi du clonage de voix et de la synchronisation labiale afin de rendre l’expérience encore plus fluide. « Nous faisons de la traduction en trente langues », précise son fondateur, Antoine Ménager, qui avait vendu sa précédente société (Signifia) en 2022.

Lire l’article complet sur : www.lesechos.fr