Accélérer la création de sous-titres via le respeaking, c’est possible ?

image décorative

Le respeaking, qu’est-ce que c’est ?

Différent des méthodes traditionnelles de sous-titrage (repérage temporel et retranscription manuelle), des méthodes de reconnaissance vocale automatique (speech-to-text) ou encore de la vélotypie/sténotypie, le respeaking (aussi appelé « redite » ou « sous-titrage vocal ») permet de générer du texte à l’écran dans un délai très court.

Pour ce faire, le « respeaker » écoute un contenu audio et répète ce qui est dit, en temps réel, dans un logiciel de reconnaissance vocale utilisant l’intelligence artificielle.

  • Le respeaking, plus précis que le speech-to-text ?

Alors que les logiciels de reconnaissance vocale sont de plus en plus performants, vous vous demandez certainement quel est l’intérêt d’avoir recours à un respeaker et en quoi ce processus est plus productif.

Malgré l’essor qu’a connu la reconnaissance vocale automatique ces dernières années, ses résultats peuvent varier en fonction de nombreux éléments extérieurs : les bruits parasites présents sur certaines bandes-son, les différences d’élocution entre les orateurs, notamment.

Le respeaker est quant à lui isolé, dans un environnement calme. Il est équipé d’un casque et d’un micro et parle clairement afin de produire un meilleur rendu de la retranscription automatique par reconnaissance vocale.

Le résultat est d’autant plus probant que le respeaker signifie au logiciel où insérer la ponctuation et corrige en temps réel les homophones (et/est par exemple) et les noms propres ou termes inconnus du logiciel.

  • Dans quel but avoir recours au respeaking ?

Si le respeaking est réalisé en direct, c’est-à-dire qu’un respeaker répète en temps réel ce qui est dit lors d’une émission par exemple, cela permet d’obtenir une retranscription de qualité et de proposer quasi immédiatement cette émission aux personnes sourdes et malentendantes, via la création de sous-titres en simultanée.

Si le respeaking est réalisé a posteriori, c’est-à-dire sur une vidéo ayant été préalablement enregistrée, cela permet d’obtenir une retranscription de l’audio de qualité et de procéder à sa traduction plus rapidement, permettant ainsi de la sous-titrer dans diverses langues et de la proposer à un public plus large plus rapidement.

Que ce soit pour une meilleure accessibilité des contenus ou bien pour la création accélérée de sous-titres multilingues, le respeaking est une solution qui suscite l’intérêt !

Et vous, l’avez-vous déjà testé ? Dites-le-nous en commentaire !

Sources :

https://slator.com/what-is-respeaking-how-does-it-improve-multilingual-subtitles/

https://www.sciencepresse.qc.ca/blogue/dire/2019/12/13/respeaking-nouveau-metier