Alors que les assistants vocaux comme Siri, Alexa ou Google Assistant peuvent être utiles pour diverses fonctions vocales, il y a des moments où vous devez effectuer certaines tâches sans déranger les autres dans, par exemple, une bibliothèque ou une zone calme au bureau. Ainsi, pour aider les utilisateurs à transmettre silencieusement des commandes vocales aux appareils intelligents, deux chercheurs de l’Université Cornell ont développé une caméra portable à reconnaissance vocale silencieuse. Jetons un coup d’œil aux détails.
Des chercheurs développent une caméra portable à reconnaissance vocale silencieuse
Cheng Zhang, professeur adjoint de sciences de l’information au Ann S. Bowers College of Computing and Information Science de l’Université Cornell, et Ruidong Zhang, doctorant à la même université, ont développé la caméra spéciale de reconnaissance vocale silencieuse.
« Imaginez que vos mains sont occupées ou que vous ne voulez tout simplement pas tendre la main à vos appareils intelligents pour interagir avec eux, vous voudrez peut-être utiliser la commande vocale. Cependant, si vous êtes dans un endroit bruyant ou en réunion, la commande vocale n’est pas efficace ni socialement appropriée. C’est là que le discours silencieux entre en place », explique Cheng Zhang, l’un des chercheurs du projet.
Il a été surnommé le « SpeeChin » car il utilise une caméra IR (infrarouge) pour capturer les mouvements du menton et du cou d’un utilisateur pour reconnaître de nombreuses commandes vocales, même lorsqu’ils chuchotent ou prononcent simplement les commandes. L’appareil est suspendu à un collier, juste en dessous du cou d’un utilisateur avec la caméra infrarouge pointée vers le haut, vers le menton.
Selon les chercheurs, la caméra capte les mouvements du menton et du cou d’un utilisateur pour reconnaître ce qu’ils essaient de dire. Par conséquent, vous pouvez chuchoter ou simplement bouger vos lèvres comme si vous disiez un certain mot ou une phrase pour que l’appareil capte la commande exacte que vous essayez de transmettre. Vous pouvez regarder la vidéo ci-dessous pour voir SpeeChin en action.
Les chercheurs disent que la caméra de reconnaissance vocale silencieuse peut reconnaître 54 phrases en anglais et commandes vocales générales, et 44 mots et phrases en chinois mandarin. Ils ont testé SpeeChin avec 20 participants, et l’appareil a pu fournir un taux de précision de 90,5 % lors de la reconnaissance des commandes en anglais et un taux de précision de 91,6 % lors de la reconnaissance des commandes en chinois. Mais, les taux de précision ont chuté lorsque les participants se déplaçaient tout en donnant des commandes silencieuses à la caméra.
Quant à la disponibilité d’un tel appareil, les chercheurs doivent clairement travailler sur la fiabilité de SpeeChin, à l’avenir. Par conséquent, il faudra peut-être un certain temps pour qu’une caméra portable à reconnaissance vocale silencieuse comme SpeeChin soit disponible dans le commerce sur le marché. Alors, que pensez-vous de SpeeChin ? Pensez-vous que ce serait un appareil réussi sur le marché? Faites-nous part de vos réflexions dans les commentaires ci-dessous.