IA et crypto : avec Ta-da, Vivoka veut faire évoluer la collecte de data
Le nouveau projet de l'entrepreneur William Simonin vise à réduire les coûts des données nécessaires à l'entraînement des modèles IA en offrant des récompenses sous forme de crypto.
La reconnaissance vocale, un secteur en rapide évolution dans le domaine de l'IA, nécessite une immense quantité de données, utilisées pour entraîner les modèles. Mais ces données sont coûteuses et souvent de qualité médiocre. Pour acheter 1 000 heures d'audio, les prix peuvent atteindre 100 000 euros.
William Simonin affirme avoir la réponse à cette problématique. Elle passe, selon le dirigeant de Vivoka, entreprise spécialisée dans la reconnaissance vocale, par la blockchain. "Ta-da" - une référence à 'Data', propose de rémunérer les utilisateurs en cryptomonnaie, en échange de leur voix, ou de n'importe quel autre type de donnée ou d'actions effectuées.
La version bêta, réservée aux utilisateurs s'étant inscrits au préalable - 2700 personnes sont sur la liste d'attente – a été lancée le 4 septembre.
Récolter des voix variées
L'ambition de Ta-da est d'accumuler des enregistrements vocaux dans une multitude de langues, qui serviront ensuite à affiner les systèmes de reconnaissance vocale de l'IA. Concrètement, les utilisateurs seront invités à lire diverses phrases dans leur langue natale, qui seront enregistrées et stockées. "Vous aurez accès à diverses tâches, chacune offrant une rémunération différente", explique William Simonin au Journal du Net.
Comme le souligne William Simonin, récolter un ensemble de données audio le plus varié possible est essentiel, surtout si l'objectif est de comprendre des langues complexes. "Former une IA en utilisant uniquement une voix masculine donnera de très bons résultats avec cette voix, explique le dirigeant de Vivoka. Cependant, si une femme interagissait avec elle, la précision pourrait diminuer."
Ainsi, avec Ta-da les récompenses seront plus élevées pour les voix rares. "Si vous parlez une langue particulière avec un accent spécifique, l'entreprise pourrait payer davantage pour des besoins uniques, comme quelqu'un parlant corse avec un accent anglais", explique William Simonin.
Les entreprises pourront ensuite accéder aux bases de données ainsi créées et acheter celles qui les intéressent. Un premier client a déjà été annoncé, Sensory (groupe Américain pour la reconnaissance vocale).
La blockchain pour garantir la qualité des données
Vivoka peut s'appuyer sur un savoir-faire acquis après avoir passé des années à élaborer un kit de développement vocal que les entreprises peuvent intégrer dans n'importe quelle interface vocale. "Nous proposons un kit de développement adapté à divers secteurs comme la robotique et la logistique", explique William Simonin. "Notamment, des entreprises et des sociétés de premier plan comme des fabricants de robots, de smartglasses, de systèmes logistiques (pick by voice), des sociétés de transport.... Actuellement, nous répondons à plus de 100 clients mondiaux, et après une phase rigoureuse de R&D de cinq ans, notre technologie est désormais intégrée dans 100 000 appareils à travers le monde."
C'est dans ce cadre que Vivoka a été confrontée aux problèmes que représente la collecte de données vocales. "Nos évaluations indiquent que seuls 5 à 10% d'un ensemble de données fait l'objet d'un examen de qualité approfondi", explique William Simonin.
En offrant des récompenses sous forme de tokens aux vérificateurs remplissant correctement leurs tâches, TA-DA espère avoir trouvé la solution pour proposer des données moins chères et de meilleure qualité. De plus, l'utilisation de la blockchain doit permettre de prouver la transparence des tâches ventilées ainsi que des vérifications effectuées, permettre les micros-paiements, et garantir la traçabilité des échanges.
Hasheur investit dans le projet
Cette confluence entre l'IA et la crypto n'est pas vraiment surprenante, étant donné la parenté de William Simonin avec Owen Simonin, alias Hasheur. Ce dernier anime la chaîne YouTube française la plus suivie, et dirige des entreprises spécialisées dans la blockchain, comme Meria, Deskoin ou encore Hash Consulting. Contribuant en tant qu'investisseur et conseiller clé pour la société de son frère, Owen Simonin a apporté son expertise sur l'aspect crypto du projet. Sa participation éclaire également la collaboration de Vivoka avec la blockchain développée par MultiversX et son PDG, Beniamin Minciu, un partenaire de longue date d'Hasheur.
"Nous considérons les fournisseurs de blockchain comme des alliés techniques essentiels", explique le dirigeant de Vivoka à propos de ce partenariat. "Collaborer avec MultiversX nous assure une relation privilégiée, alors que nous n'aurions été qu'un projet parmi tant d'autres sur une autre blockchain". Alors que Ta-da se prépare pour son lancement public, il vise dans un premier temps des marchés comme la Roumanie, le Vietnam, le Royaume-Uni, la France et l'Espagne.