Depuis bientôt 5 ans, nous entendons parler de traduction automatique neuronale. Elle a aujourd’hui rendu obsolètes les autres formes de traduction automatique (notamment statistique et à base de règles) tant elle est performante. Elle est devenue la norme sur le marché.
Nous en parlons comme si c’était une évidence, et pourtant elle soulève encore des interrogations, même chez les professionnels du secteur.
Qu’est-ce que la traduction automatique neuronale ?
Il s’agit d’un processus de traduction automatique générée par un moteur qui fonctionne sur le même principe qu’un réseau de neurones. Grâce à l’intelligence artificielle, le moteur ne réfléchit plus en termes de mots ou d’expressions, mais en bloc à traduire, pour obtenir un contexte complet du document. Par conséquent, la fluidité, la qualité et la terminologie de la traduction proposée sont d’une qualité remarquable. Il faut tout de même nuancer ce propos car la traduction automatique nécessite toujours une intervention humaine pour corriger et rectifier le texte brut. C’est ce que l’on appelle la post-édition.
Quelle est la différence entre la traduction automatique à base de règles, statistique, et neuronale ?
A base de règles : les moteurs sont élaborés à partir des règles linguistiques et grammaticales, ainsi que de dictionnaires existants pour générer un texte brut.
Statistique : comme son nom l’indique, les modèles se basent sur l’analyse de données/corpus multilingues et détermine la traduction automatique sur la probabilité statistique de correspondance entre le texte original et sa traduction.
Neuronale : elle fonctionne sur le même principe qu’un réseau de neurones artificiels pour apprendre les règles d’une langue à partir d’un modèle statistique. L’apprentissage est évolutif et s’améliore avec le temps : plus on alimente le moteur, meilleure sera la traduction brute.
Quelle sont les utilisations faites à partir de la traduction neuronale ?
Comme évoqué plus haut, la traduction neuronale est aujourd’hui la norme pour travailler en post-édition. Vous pouvez notamment l’utiliser pour des types de documents techniques où le style et la fluidité ne sont pas primordiaux, des documents internes et qui n’ont pas vocation à être publiés, ou encore pour comprendre ou répondre à des appels d’offres.
Quels sont les types de moteurs neuronaux existants ?
Tout le monde peut aujourd’hui disposer d’une version professionnelle d’un moteur neuronal (DeepL, ModernMT), en s’acquittant d’un abonnement mensuel ou annuel. Outre les éditeurs qui vendent des moteurs « prêts à l’emploi », il est possible de créer son propre moteur neuronal à partir de modèles prédéfinis et de données/corpus multilingues. Cette solution reste néanmoins coûteuse et chronophage, et nécessite des ressources financières et humaines importantes.
Et vous, que pensez-vous de cette technologie ?