Introduction

La société belge Acapela, qui développe des logiciels et services de synthèse vocale, étend au marché français sa prestation « My-own-voice ».
My-own-voice est un service permettant la création en ligne de sa propre voix numérique : une technique aujourd’hui accessible aux personnes avant une perte prévisible de la parole consécutive à une opération (laryngectomie), ou suite à une maladie neurodégénérative comme la sclérose latérale amyotrophique.
My-own-voice nécessite un apprentissage vocal consistant à enregistrer 350 phrases. Après quoi une version numérique est proposée afin de la tester au sein d’une interface de démonstration. Après acquisition, la voix peut être utilisée sur ordinateur ou tablette, en complément d’un logiciel ou application facilitant la communication au quotidien, assistée par une voix de synthèse unique, conservant l'empreinte de la voix originale pour ce qui est du timbre, de l'accent et de l'intonation.
Acapela "My-own-voice"

Spécifications techniques

Référence My-own-voice
Fabriquant Acapela Group (Belgique) www.acapela-group.com
My-own-voice : mov.acapela-group.com
Prix 999€ HT ou abonnement annuel de 99 € HT
Disponible en version Windows (format SAPI), iOS (via une application partenaire, ex : Predictable de Therapy-box) et Android (via une application partenaire ou en voix système Google, non disponible avec le modèle abonnement)
Personne laryngectomisée utilisant sa propre voix sur tablette tactile

La société Acapela

Créé en 2003, Acapela Group est une société belge qui développe des logiciels et services de synthèse vocale. Ses voix, nous les connaissons car de nombreux éditeurs de logiciels d’aide à la communication, ou d’aide à la production d’écrits les utilisent. Nous les connaissons également sous forme de clé usb pour donner la parole à n’importe quel PC et lire n’importe quel texte écrit prononcé par des voix agréables et naturelles.
Interface logicielle Acapela Recorder (paramétrage)
Vous pouvez découvrir et tester ces voix en plusieurs langues depuis la page d’accueil du site : www.acapela-group.com
Disposant d’un important catalogue de voix, la société propose aux entreprises de les personnaliser pour apporter une identité propre à leurs serveurs vocaux.
My-own-voice est un service proposant de restituer leur voix à ceux qui l’ont perdue à la suite d’un accident ou d’un problème de santé.

Voix numérisée et empreinte vocale

Il existe aujourd’hui des techniques permettant de produire des voix de synthèse de très grande qualité, fidèles et quasi identiques à la voix humaine. Nécessitant un matériel spécialisé (conditions de studio), un volume important d’heures consacrées à l’enregistrement, et une longue intervention humaine, cette technique n’est pas accessible au grand public, pour des problèmes de coût de production.
La solution proposée par Acapela est toute différente : greffer sur une voix de synthèse existante, les caractéristiques d’une voix enregistrée en seulement 350 phrases, non pas proposer une voix fidèle à la voix originale, mais une voix reproduisant l’empreinte vocale de la personne en terme de de timbre, d'accent et d'intonation.

Enregistrer sa voix

Le service ne demande aucune compétence ni équipement particulier, si ce n’est un ordinateur, un micro-casque et une connexion. Préalablement, il faut solliciter la création d’un compte à l’adresse : mov.acapela-group.com/start-now. Après connexion grâce au login communiqué, vous serez invité à télécharger le logiciel « Acapela Recorder », disponible en version Mac et Windows. Au lancement, le logiciel vous invitera à choisir la langue, puis de choisir et configurer le microphone : un micro-casque ou microphone sur pied (USB). L'utilisation d'un microphone interne est déconseillée.
Exemple de microphones USB conseillés pour l’enregistrement de la voix :
- micro-casque usb
- microphone usb sur pied
(ex : TableMike usb 6-in-1)
La FAQ disponible sur le site apporte tout/s renseignement/s concernant le service proposé, à commencer par les conditions d’enregistrement (dans une pièce calme en évitant toute source de bruit de fond), comment parler, comment effectuer l’enregistrement en différentes sessions en fonction du temps disponible et des contraintes vocales. L’interface du logiciel affiche les phrases à prononcer et une série de boutons affichant les fonctions classiques d’un magnétophone. Les phrases imposées ont été conçues par des linguistes : la plupart ne posent pas de problèmes, mais certaines peuvent paraître incongrues et correspondent à l’énonciation de diphones nécessaires au logiciel. Vous pouvez faire des retours sur les phrases posant problème.
Il est possible de faire énoncer la phrase par voix de synthèse avant de procéder à l’enregistrement, de réécouter une phrase enregistrée pour la valider, ou la recommencer avant de passer à la phrase suivante. Une validation de la qualité des premiers enregistrements est proposée à la dixième phrase, avant de poursuivre. A l’issue des 350 phrases enregistrées, une requête est proposée afin de fabriquer la voix. Une connexion est à ce moment requise. Un message via e-mail vous informera de la disponibilité de la voix, prête à être testée dans le module de démonstration.

Module de démonstration

La voix peut être testée depuis un module de démonstration accessible depuis l’onglet listen (écoute) du site. Celui ci comporte une fenêtre permettant de saisir ou copier un texte puis de l’entendre en cliquant sur le bouton de lecture. Deux réglages sont proposés :
  • vitesse de lecture (en mots par minute)
  • mise en forme de la voix (réglage en pourcentage grave / aigu)
Module de démonstration de la voix numérisée
Le service est gratuit jusqu'à ce que vous décidiez d'utiliser la voix dans une application spécifique, ce qui vous donne la possibilité de tester et de vérifier la qualité de la voix, voire de la réenregistrer avant d'en faire l’acquisition.
Configuration et calibration du microphone avant le début des enregistrements

Principales pathologies concernées

Pathologies cancéreuses

Sont notamment concernées les pathologies cancéreuses nécessitant une ablation des cordes vocales et de la langue. « L’intérêt est que la technique soit non invasive et permette une véritable alternative à tous les échecs actuels de la réhabilitation vocale : voix œsophagienne, implant phonatoire, laryngophone » (Professeur Franck Jegoux, service ORL du CHU de Rennes). Des études portant sur la qualité de vie ont démontré que la perte de voix, de la communication ou simplement la difficulté à articuler, conduisent à une perte globale de la qualité de vie, provoquant un repli sur soi accompagné de dégâts psychologiques importants.

Maladies neuro-dégénératives

La sclérose latérale amyotrophique (SLA), par exemple, aussi connue sous le nom de maladie de Charcot, est une maladie neurodégénérative qui provoque une paralysie progressive des membres qui affecte également la phonation et la déglutition. De nombreuses personnes souffrant de la SLA utilisent déjà pour communiquer une voix de synthèse, mais jusqu’à présent en la choisissant dans un catalogue. Utiliser une voix reproduisant leur empreinte vocale les séduirait très certainement ainsi que leurs proches. Cependant, auprès de ces malades, l’annonce d’une possibilité de compensation doit faire l’objet d’une annonce très circonstanciée compte tenu que la maladie est évolutive. L’intérêt d’une solution comme My-own-voice est qu’elle peut être mise en place précocement, dans le cadre d’une rééducation orthophonique comme exercice pour entraîner l’élocution, en apprenant à se ré-écouter. C’est à dire, bien avant la nécessité de mettre en place une aide à la communication. Une autre particularité de la SLA, est l’atteinte progressive des membres, d’où la nécessité de choisir des solutions logicielles adaptées et évolutives notamment au niveau des modes d’accès. Les solutions sont fort heureusement nombreuses et fréquemment évoquées dans nos fiches techniques.

Formats livrables et exemples d’applications

Les voix peuvent être fournies sous différents formats :
  • Windows Sapi 5 : compatible avec de nombreux logiciels d’aide à la communication dotés de modes d’accès évolutifs (Grid 3, Mind Express Amego, Communicator 5)
  • Android : API / TTS (Text To Speech), utilisable sur certaines applications recommandées pour une approche tactile. Ex : Assistant Parole, disponible sur GooglePlay en version gratuite, ou complète à 5,70 €
  • sous iOS, au sein d’applications partenaires : le partenariat récent entre Acapela et Therapy Box (avril 2019) permet aux utilisateurs de l’application Predictable d’utiliser directement les voix My-own-voice au sein de l’application. Présentée dans notre fiche technique N° 152 en rubrique « Aides à la communication », Predictable est une application de communication avec synthèse vocale pour iPhone et iPad, conçue pour des personnes avec difficultés de communication ayant conservé l’accès à l’écrit, même avec d’importantes difficultés motrices grâce à l'usage possible de contacteur(s). L’application est disponible en français sur l’AppleStore au prix de 229,99 €
Assistant Parole : application d’aide à la communication sous Android
Application « Prédictable » de Therapy Box disponible en français sur l’AppleStore

Conclusion

Ma voix ainsi numérisée, je l’ai fait écouter à des proches ou collègues. Tous l’ont reconnue, et plusieurs m’ont déclaré : « Ce n’est pas exactement ta voix, mais quelque chose dans cette voix nous fait bien penser à toi ». C’est là l’objectif annoncé par Acapela : permettre aux personnes qui ont besoin d’une voix prothétique de ne plus seulement la choisir au sein d’un catalogue, mais leur offrir à un prix devenu abordable, une voix personnalisée qui est l’essence de la leur.