L’intégration de la voix et de la reconnaissance vocale dans les applications mobiles

L’intégration de la voix et de la reconnaissance vocale dans les applications mobiles

Même si elle a mis du temps à s’imposer, la voix s’apprête à révolutionner l’univers du smartphone. Au confluent du data mining, du machine learning et du traitement automatique des langues, les technologies de reconnaissance vocale ont fait d’immenses progrès et ouvrent de belles perspectives aux développeurs d’applications mobiles.

Les atouts de la voix

Loin d’être de simples gadgets, les assistants vocaux nous permettent de nous affranchir des contraintes des écrans tactiles, et sont extrêmement utiles notamment aux non-voyants et personnes handicapées. Grâce à eux, on peut interagir plus vite et plus intelligemment avec nos smartphones, mais aussi avec les objets connectés qui se multiplient autour de nous, comme les smart speakers qui font aujourd’hui fureur. Des start-ups travaillent déjà sur des applications dont on se servira à 100 % en mode mains libres, ce qui sera notamment très pratique en voiture.

Reconnaissance et synthèse vocale : deux technologies utilisées pour les applications mobiles

Il existe deux types de technologies vocales, qui peuvent être intégrées séparément ou ensemble dans une application mobile. Avec la reconnaissance vocale, les mots prononcés par l’utilisateur sont convertis en texte, ce qui permet de donner des instructions à l’application. On peut aussi s’en servir pour envoyer des messages, faire des recherches sur le web et prendre des notes.

La synthèse vocale est basée sur le principe inverse : on passe du texte à la voix. Elle est utilisée pour communiquer avec l’utilisateur en lui donnant des informations ou en lui lisant du texte à la demande. Amazon l’a intégrée avec succès dans son appli Kindle pour iOS, qui « lit » à voix haute des livres grâce à l’outil VoiceOver d’Apple.

reconnaissance vocale dans les applications mobiles

Réussir l’intégration de la voix

Dans l’idéal, une application mobile devrait intégrer à la fois la synthèse et la reconnaissance vocale. La tâche est toutefois complexe. Il faut y aller de façon itérative, en commençant par les fonctionnalités les plus souvent utilisées par les mobinautes, et où le risque d’erreur est faible. Des fonctionnalités supplémentaires seront ajoutées à chaque mise à jour de l’application. Dans certains cas, mieux vaut se passer complètement de la synthèse vocale : si une application contient peu de texte à lire, il est beaucoup plus simple d’y ajouter des clips audio.

Des outils pour donner de la voix aux applications mobiles

Créer son propre assistant vocal demande des compétences extrêmement pointues. Dans la vaste majorité des cas, les développeurs se tournent vers des solutions clés en main. Deux types d’outils existent : les outils dans le cloud, légers et rapides, qui ont pour inconvénient de ne fonctionner qu’avec une connexion internet. D’autres assistants vocaux sont directement intégrés à l’application, qui peut ainsi fonctionner hors connexion, mais qui est forcément plus lourde. Le plus simple est d’utiliser les SDK de Google et d’Apple, qui proposent des outils vocaux sur le cloud aux développeurs.

Laisser un commentaire