Introduction

Lancée par Google en février 2019 en version béta sous le nom de Live Transcribe et depuis plusieurs fois mise à jour, l’application Transcription instantanée utilise la reconnaissance vocale de Google pour afficher la voix en temps réel sur l’écran de son smartphone.
Conçue avec la collaboration de l’Université de Gallaudet (Etats-Unis) à l’attention d’étudiants sourds ou malentendants, l’application est particulièrement adaptée pour faciliter une communication en face à face : les paroles de l'interlocuteur sont instantanément affichées à l'écran du smartphone ou d'une tablette afin de suivre et participer aux conversations.

Spécifications techniques

Référence Transcription instantanée (Android version 5.0 ou ultérieure)
Fabricant Google
Application créée en collaboration avec l'université Gallaudet (Etats-Unis)
support.google.com/accessibility/android/answer/9158064?hl=fr
Distributeurs Téléchargeable sur GooglePlay
Prix Gratuite
Transcription instantanée : une aide à la communication pour personnes sourdes ou malentendantes

Utilisation

L’application nécessite d’être connecté à internet.
A l’ouverture, l’application demande d’accéder au microphone de l’appareil, après quoi un message «Prêt à transcrire » apparaît, puis la transcription de la voix en texte commence au sein d’une interface épurée.
Affichage en temps réel de la parole sur l’écran d’un smartphone
Le texte s’affiche pendant toute la durée de la conversation : il est possible de scroller pour revenir en arrière, ou mettre l’affichage en pause le temps de la lecture. En présence de plusieurs interlocuteurs, l’utilisation de l’application à destination d’une personne sourde ou malentendante doit être connue afin que chacun s’exprime à tour de rôle pour garantir une cohérence du discours affiché. L’application est compatible avec 70 langues, avec possibilité de reconnaître une langue principale et une langue secondaire en cours d’utilisation.
Transcription instantanée reconnaît la voix, mais également certains sons autres que la parole :
  • sons humains : rire, applaudissements, toux, sifflement...
  • sons d’ambiance : musique, sonnette, chien qui aboie, toc-toc (frappe à la porte)...

  • Ces informations apparaissent en bas d’écran sous forme d’étiquettes colorées :
A l’intention des personnes qui ne communiquent pas verbalement, une icône en bas d’écran permet d’appeler un clavier virtuel en vue de répondre par écrit. L’application ne permet pas encore de retour vocal par voix de synthèse.

Paramétrage

En bas d’écran, l’icône en forme de roue dentée permet d’accéder aux paramètres de l’application.

Taille du texte

De très petite à très grande, cinq tailles sont proposées.
Paramètres : réglage de la taille du texte affiché

Enregistrement de la transcription

Par défaut les données audio ne sont pas conservées après leur traitement. En activant cette fonction, la transcription enregistrée reste disponible pendant trois jours, en local. Possibilité de supprimer l’historique.

Affichage

Deux thèmes sont proposés : caractères blancs sur fond noir ou l’inverse.

Audio et langue

Possibilité de choisir une voix principale et une voix secondaire parmi 70 langues compatibles. (Pas d’option de traduction).

Evénements

  • Vibration : option qui permet au téléphone de vibrer pour attirer l’attention lorsqu’une personne recommence à parler après une pause d’au moins 10 secondes.
  • Libellés sonores : option qui permet d’obtenir la description des sons autres que la parole.

Options avancées

  • Masquer les grossièretés.
  • Afficher le bouton suspendre la transcription : cette option fait apparaître un bouton pause en bas d’écran pour masquer temporairement la transcription, le temps de lire le texte affiché, sans interrompre la retranscription qui continue de fonctionner en arrière plan.

Utilisation en réunion, cours, conférences

Conseils pour une utilisation optimale à deux ou en petit groupe

Initialement conçue pour une utilisation en face à face, la reconnaissance vocale est suffisamment sensible pour reconnaître la voix de plusieurs personnes distantes de quelques mètres comme dans le cas d’une réunion restreinte, à condition d’opérer dans un milieu peu bruyant ou chacun prend la parole à tour de rôle.
Utilisation de Transcription instantanée en réunion restreinte

Adaptations à envisager pour une utilisation au sein d'un groupe

L'utilisation de l'application en cours ou conférence reste possible. Il sera alors judicieux d’utiliser un microphone sans fil placé au plus près de l’orateur. Fort heureusement, l’application permet la reconnaissance de microphones externes (Audio/Langue/Micro).
Exemple de microphone sans fil (HF) pour scène, conférence, etc.
Ces microphones existent dans le domaine public, et se trouvent dans les magasins d’articles de sonorisation ou auprès de nombreux vépécistes sur internet. Ils utilisent une radio fréquence ou parfois le Bluetooth.
Enregistrement à distance depuis une enceinte ou micro Bluetooth (portée 15 mètres)
L'utilisateur trouvera un test en magasin utile, en tenant compte de l’autonomie du microphone, sa portée, microphone tenu en main ou sur pied, et sa directivité : privilégier un microphone directionnel, qui capte la parole d’un locuteur tout en atténuant les bruits latéraux.
Bien choisir mon micro HF : testmateriel.net/meilleur-micro-hf

Conclusion

La reconnaissance vocale est utilisée depuis longue date comme outil d’aide à la participation en réunion de personnes sourdes ou malentendantes comme en témoigne notre fiche technique N° 50 en rubrique insertion professionnelle, consacrée au sténomasque Sylencer (cf Kit 140 Sylencer Stenomasque) utilisé conjointement avec le logiciel Dragon Naturaly Speaking.
Utilisant la reconnaissance vocale de Google, l’application Transcription instantanée simplifie et démocratise cette technique en la rendant accessible depuis un simple smartphone.
L’application demeure cependant perfectible sur de nombreuses fonctions annexes comme le choix des polices et couleurs d’affichage, une fonction pause plus fonctionnelle, un retour vocal par voix de synthèse des messages écrits depuis le clavier virtuel, etc.
Une adresse mail est communiquée pour les remontées d’informations.
Transcription instantanée :
play.google.com/store/apps/details?id=com.google.audio.hearing.visualization.accessibility.scribe