Qu'est-ce que la traduction automatique neuronale ?

C'est une technologie de traduction automatisée utilisant des réseaux neuronaux. Sa traduction est plus précise, elle tient compte du contexte et ne traduit pas les mots individuellement.

Traduction automatique neuronale

Des premières langues écrites à nos jours, la traduction humaine a toujours été un moyen important pour connecter les différents peuples du monde. Alors que nous continuons à passer de plus en plus de temps en ligne, la traduction est devenue un moyen important d'atteindre de grands publics mondiaux qui recherchent des informations sur internet. Depuis des années, la traduction était un processus hautement manuel qui comptait uniquement sur le travail humain être accompli. Bien que pour traduire un document, la traduction humaine reste le moyen le plus fiable, elle prend plus de temps et est souvent plus onéreuse si chacun de vos contenus devait être traduit. Les traducteurs avaient des contraintes sur le volume de contenu qu’ils pouvaient s’attendre à traduire avec précision à un moment donné, ce qui signifie qu’il existait de grands volumes de contenu pour lesquels il aurait été difficile de justifier la traduction en termes de temps, de coût et d’effort investis. Une autre méthode de traduction a commencé à apparaître ces dernières années avec l’avènement de la traduction automatique (MT) dans les années 1940 et 1950. La traduction automatique a radicalement transformé le processus de traduction au moment où la puissance de l’IA et de l’automatisation est venue s’ajouter au processus de traduction. Une introduction à la traduction automatique

À sa base, la traduction automatique est un logiciel entièrement automatisé qui traduit du contenu d’une langue à l’autre. Une grande partie du contenu disponible dans le monde est inaccessible aux personnes qui ne parlent pas la langue source dans laquelle le document original a été rédigé. La traduction automatique est là pour permettre de traduire un contenu efficacement et plus rapidement, en plusieurs langues. On utilise des systèmes de traduction automatique le plus souvent lorsqu’il y a beaucoup d’informations à traduire (c’est-à-dire des centaines de milliers de mots ou plus). Dans ces situations, la traduction humaine traditionnelle ne serait pas possible en raison du volume de contenu, donc nous nous tournons vers l'IA. Il existe de nombreux types de systèmes de MT et différentes approches de la MT, notamment : la MT basée sur des règles (RbMT) : des algorithmes sont créés en fonction de la grammaire, de la syntaxe et de la sémantique de la langue. Des linguistes rédigent de grands ensembles de règles pour chaque paire de langues (c’est-à-dire de l’anglais à l’espagnol, de l’anglais au français, etc.). Le contenu est alors traité au moyen de ces algorithmes et traduit dans la langue demandée.

Traduction automatique statistique (SMT) : ce type de traduction automatique se base sur un texte de référence et recherche les traductions qui, statistiquement, seraient les plus susceptibles d'être utilisées. Ces systèmes sont non seulement en mesure d’être entraînés plus rapidement que les systèmes de traduction automatique basée sur des règles, mais plus important encore, cet entraînement nécessite beaucoup moins d’interventions humaines.

Traduction automatique neuronale (NMT) : même si les traductions automatiques statistiques et neuronales utilisent d'énormes ensembles de données de phrases traduites pour apprendre aux logiciels à trouver les meilleures traductions, les modèles en eux-mêmes sont bien distincts. En effet, la traduction automatique statistique traduit des phrases en les divisant en expressions, en traduisant les différentes parties, puis en essayant de relier ces traductions ensemble. De son côté, la traduction automatique neuronale utilise des réseaux neuronaux qui tiendront compte de l’intégralité de la phrase au moment de prédire une traduction, prenant ainsi en considération le contexte dans lequel chaque mot et chaque expression sont utilisés.

Qu’est-ce qu’un réseau neuronal ?

Un réseau neuronal est une forme d’apprentissage automatique. Un ordinateur apprend à exécuter une tâche en utilisant des données provenant d’exemples précédents de cette tâche. Cependant, la personne qui programmait le réseau neuronal ne définit pas réellement ce que ces modèles devraient être : le système apprend seul. Par exemple, un système de reconnaissance d'objet est formé à détecter des objets en temps réel pour mieux trouver et prévoir des modèles. Dans une voiture à conduite automatique, un système de reconnaissance d’objets doit savoir interpréter chaque objet qui se trouve dans son champ de vision. Pour s'entraîner, le système reçoit des milliers d'images préétiquetées de maisons, de personnes, d'arbres, etc., afin de trouver des modèles pour comprendre plus précisément les objets dans la vie réelle. Lorsqu'il s'agit de la traduction, les réseaux neuronaux sont uniques en leur capacité à déterminer les caractéristiques linguistiques importantes qui sont pertinentes à une traduction sans avoir besoin d'un programmateur qui leur indique ce qui est important. Ils sont également en mesure de faire des prédictions dans le contexte, même dans des situations complexes, comme utiliser une vidéo entière et son script ensemble au lieu d'une simple image. D'un autre côté, dans les précédents systèmes basés sur des règles, les linguistes faisaient l'ébauche d'algorithmes qui définissaient les règles de traduction entre deux langues. La traduction de la langue originale du texte source dans une langue cible se faisait sur la base de ces règles. Ce processus prenait non seulement beaucoup de temps, mais il empêchait au système d’apprendre et de s’adapter à mesure que de nouveaux modèles étaient créés. Comment fonctionne la NMT ?

Un réseau neuronal est une forme d’apprentissage automatique. Un ordinateur apprend à exécuter une tâche en utilisant des données provenant d’exemples précédents de cette tâche. Cependant, la personne qui programmait le réseau neuronal ne définit pas réellement ce que ces modèles devraient être : le système apprend seul. Par exemple, un système de reconnaissance d'objet est formé à détecter des objets en temps réel pour mieux trouver et prévoir des modèles. Dans une voiture à conduite automatique, un système de reconnaissance d’objets doit savoir interpréter chaque objet qui se trouve dans son champ de vision. Pour s'entraîner, le système reçoit des milliers d'images préétiquetées de maisons, de personnes, d'arbres, etc., afin de trouver des modèles pour comprendre plus précisément les objets dans la vie réelle. Lorsqu'il s'agit de la traduction, les réseaux neuronaux sont uniques en leur capacité à déterminer les caractéristiques linguistiques importantes qui sont pertinentes à une traduction sans avoir besoin d'un programmateur qui leur indique ce qui est important. Ils sont également en mesure de faire des prédictions dans le contexte, même dans des situations complexes, comme utiliser une vidéo entière et son script ensemble au lieu d'une simple image. D'un autre côté, dans les précédents systèmes basés sur des règles, les linguistes faisaient l'ébauche d'algorithmes qui définissaient les règles de traduction entre deux langues. La traduction de la langue originale du texte source dans une langue cible se faisait sur la base de ces règles. Cela a non seulement pris beaucoup de temps, mais a également empêché le système d'apprendre et de s'adapter à mesure que de nouveaux modèles émergeaient. Le but de n'importe quel modèle de MT neuronal est de se saisir d'une entrée dans une langue et de la retranscrire dans une autre langue. La première chose à comprendre est de savoir comment une entrée dans une langue est transformée en données qui peuvent être utilisées par le modèle de NMT. Les modèles de NMT utilisent une méthode de traduction plus communément appelée la structure d'encodeur-décodeur Cette structure prend en charge le contenu dans sa langue source originale, attribue à chaque mot un nombre, trouve le mot correspondant dans la langue cible, puis lance une traduction dans la nouvelle langue en utilisant la représentation numérique qu'a chaque mot. Dans cette représentation visuelle de la structure d'encodeur-décodeur, la phrase source « Le chat aime manger de la pizza » entre dans la structure d'encodeur-décodeur à gauche. Le travail de l’encodeur consiste à transformer chaque mot individuel en une représentation de phrase complète. Le nuage gris représente le sens de toute la phrase sous sa forme numérique (à la place de chaque mot qui la compose). À partir de là, la structure utilise ensuite des algorithmes pour cartographier la probabilité de la traduction la plus vraisemblable en fonction du reste des mots de la phrase en question. Le décodeur entre ensuite en action pour transformer cette représentation numérique en mots : « El gato le gusta comer pizza ». En quoi la traduction automatique neuronale est-elle différente ?

Bien que la traduction automatique statistique utilise également des méthodes de substitution numérique pour réaliser la traduction, elle n’établit pas de relations entre les mots. Cependant, si les données utilisées pour former un modèle de NMT montrent un cas d'utilisation similaire entre deux mots, le modèle attribuera des valeurs numériques plus proches entre eux. Par exemple, un modèle de NMT peut attribuer aux mots « mais » et « à l'exception » les valeurs numériques de 4.12 et 4.16 si les données montrent un cas d'utilisation similaire afin qu'elles soient plus susceptibles d'être échangées. Les modèles de traduction automatique neuronale ne font pas d’hypothèses indépendantes. Tous les aspects de la traduction tiennent toujours compte de l’intégralité du contexte de la phrase, y compris les mots exacts et l’ordre dans lequel ils apparaissent. C'est pourquoi les systèmes de NMT ont tendance à maintenir plus de fluidité que les autres modèles de traduction. Qu'est-ce que la MT neuronale adaptative ?

La traduction automatique neuronale adaptative est un modèle de traduction automatique neuronale qui s’adapte rapidement aux commentaires des traducteurs au fur et à mesure de leur travail. L’adaptation signifie que le système peut rapidement devenir très spécifique au traducteur, ce qui lui permet de travailler avec un système plus intuitif. Il existe deux types communs d’adaptation : l’adaptation par lots (entraînement du modèle avec des mémoires de traduction) et l’adaptation en ligne (entraînement du modèle avec les retours du traducteur à mesure qu’il travaille). Un système de traduction automatique adaptative a plusieurs avantages. Il reçoit en permanence les commentaires des linguistes pendant qu’ils traduisent, il se met à jour rapidement et apprend instantanément. Cela signifie que vous n’avez plus à investir dans un ré-entraînement coûteux et complexe du système de référence. En raison du coût et de la complexité, la rééducation du système se produit en pratique souvent beaucoup moins souvent qu'elle ne le devrait. Quelle est la bonne méthode de traduction pour moi ?

La méthode de traduction à adopter dépend de vos besoins. En fonction du contenu, certains types de traduction peuvent être plus adaptés que d’autres. Lorsque la rapidité d’exécution et les coûts priment sur la qualité, comme pour traduire les contenus générés par les utilisateurs, une traduction automatique brute peut vous suffire. Pour toutes les autres situations, lorsque c’est la qualité qui prime, la meilleure option est la traduction automatique neuronale avec un flux de travail impliquant l’intervention d’un humain. Après tout, l’avenir de la traduction automatique implique l’intervention de l’humain. En effet, c’est ainsi que vous pourrez non seulement tirer parti des fonctionnalités de la traduction automatique, mais aussi préserver le niveau d’efficacité et de qualité propre aux traducteurs humains.

Traduisez avec Lilt dès aujourd'hui