¿Qué es la traducción automática neural?

La traducción automática neural es una tecnología de traducción totalmente automatizada que utiliza redes neuronales. La TAN proporciona una traducción más precisa al tener en cuenta el contexto en el que se usa una palabra, en lugar de simplemente traducir cada palabra individual por sí misma.

Traducción automática neuronal

Desde los idiomas escritos más antiguos hasta la actualidad, la traducción humana siempre ha sido una forma importante de conectar el mundo. A medida que seguimos llevando nuestras vidas al entorno virtual, la traducción se ha convertido en una forma esencial para llegar a grandes públicos globales que buscan información en Internet. Durante muchísimo tiempo, la traducción ha sido un proceso sumamente manual que se basaba únicamente en el trabajo humano. Si bien la traducción humana sigue siendo la forma más confiable de traducir contenido, tarda más y tiende a ser más costosa si se hace para cada contenido individual. Los traductores tenían limitaciones respecto al volumen de contenido que previsiblemente podían traducir con precisión en un plazo determinado, lo que suponía que era poco factible traducir grandes volúmenes de contenido por el tiempo, el costo y los esfuerzos implicados. Más recientemente han aparecido métodos de traducción alternativos con la aparición de la traducción automática (TA) en la década de 1940 y 1950. La traducción automática cambió completamente la forma en que se podía hacer una traducción, ya que agregó una potente IA y la automatización al proceso de traducción. Introducción a la traducción automática

En esencia, la traducción automática es un programa de software totalmente automatizado que traduce el contenido de un idioma a otro. Dado que una gran parte del contenido del mundo es inaccesible para las personas que no hablan el idioma de origen, la TA puede traducir el contenido más rápidamente y a más idiomas. Los sistemas de TA se utilizan más comúnmente cuando hay mucha información que debe traducirse (p. ej., cientos de miles de palabras o más). En esas situaciones, la traducción humana tradicional no sería factible debido al gran volumen de contenido, por lo que recurrimos a la IA. Hay varios tipos de sistemas de TA y diferentes enfoques. Entre ellas se destaca la TA basada en reglas (TABR): los algoritmos se crean según la gramática, la sintaxis y la semántica del idioma. En este caso, los lingüistas escriben grandes conjuntos de reglas para cada par de idiomas (por ejemplo, EN-ES, EN-FR, etc.). Luego, el contenido pasa por estos algoritmos y se traduce al idioma apropiado.

TA estadística (TAE): este tipo de TA toma un texto de referencia y encuentra traducciones que son estadísticamente más probables para su uso. Estos sistemas se pueden entrenar más rápidamente que la TABR y, principalmente, se requiere mucho menos esfuerzo humano para ello.

TA neuronal (TAN): si bien tanto la TA estadística como la neuronal usan enormes conjuntos de datos de frases traducidas para enseñar al software a encontrar la mejor traducción, los modelos son diferentes. Para traducir, la TA estadística descompone las frases, traduce los fragmentos y, luego, intenta volver a unir esas traducciones. Por otro lado, la TA neuronal utiliza redes neuronales para evaluar frases completas a la hora de predecir traducciones, y eso le permite tener en cuenta el contexto en que se usa cada palabra y frase.

¿Qué es una red neural?

Una red neuronal es una forma de aprendizaje automático en la que una computadora aprende a realizar una tarea utilizando datos de ejemplos anteriores de esa tarea. Sin embargo, la persona que programa la red neuronal no define cuáles deberían ser esos patrones; el sistema aprende por sí mismo. Por ejemplo, un sistema de reconocimiento de objetos está entrenado para detectar objetos en tiempo real a fin de encontrar y predecir patrones de mejor manera. Un sistema de reconocimiento de objetos diseñado para la conducción automática de un auto debe entender cada objeto que tenga a la vista. Para entrenar, el sistema recibe miles de imágenes de casas, personas, árboles, etc., para que pueda encontrar patrones y entender objetos con mayor precisión en la vida real. Cuando se trata de la traducción, las redes neuronales son únicas en su capacidad de determinar las características importantes del idioma que son pertinentes para una traducción, sin que un programador le indique qué es importante. También pueden hacer predicciones en contexto, incluso en situaciones complejas, como usar un video completo y su script juntos en lugar de solo un marco individual. Por otro lado, en los sistemas anteriores basados en reglas, los lingüistas escribían algoritmos que definían las reglas de la traducción entre dos idiomas. Luego, un texto fuente se traducía del idioma original a un idioma de destino según esas reglas. Esto no solo exigía una enorme cantidad de tiempo, sino que también impedía que el sistema aprendiera y se adaptara a nuevos patrones. ¿Cómo funciona la TAN?

Una red neuronal es una forma de aprendizaje automático en la que una computadora aprende a realizar una tarea utilizando datos de ejemplos anteriores de esa tarea. Sin embargo, la persona que programa la red neuronal no define cuáles deberían ser esos patrones; el sistema aprende por sí mismo. Por ejemplo, un sistema de reconocimiento de objetos está entrenado para detectar objetos en tiempo real a fin de encontrar y predecir patrones de mejor manera. Un sistema de reconocimiento de objetos diseñado para la conducción automática de un auto debe entender cada objeto que tenga a la vista. Para entrenar, el sistema recibe miles de imágenes de casas, personas, árboles, etc., para que pueda encontrar patrones y entender objetos con mayor precisión en la vida real. Cuando se trata de la traducción, las redes neuronales son únicas en su capacidad de determinar las características importantes del idioma que son pertinentes para una traducción, sin que un programador le indique qué es importante. También pueden hacer predicciones en contexto, incluso en situaciones complejas, como usar un video completo y su script juntos en lugar de solo un marco individual. Por otro lado, en los sistemas anteriores basados en reglas, los lingüistas escribían algoritmos que definían las reglas de la traducción entre dos idiomas. Luego, un texto fuente se traducía del idioma original a un idioma de destino según esas reglas. Esto no solo exigía una enorme cantidad de tiempo, sino que también impedía que el sistema aprendiera y se adaptara a nuevos patrones. El objetivo de cualquier modelo de TA neuronal es tomar un mensaje en un idioma y enviarlo a otro idioma. Lo primero que hay que entender es cómo el mensaje en un idioma se transforma en datos que el modelo de TAN pueda usar. Los modelos de TAN usan un método de traducción más comúnmente llamado estructura de codificador-decodificador. Esta estructura toma el contenido en su idioma fuente original, asigna un número a cada palabra, encuentra la palabra correspondiente en el idioma de destino y, luego, produce una traducción en el nuevo idioma usando la representación numérica que tiene cada palabra. En esta representación visual de la estructura de codificador-decodificador, la frase de origen «the cat likes to eat pizza» entra en la estructura de codificador-decodificador a la izquierda. El codificador debe transformar las palabras individuales en una representación de oración completa. La nube gris representa el significado de la oración completa en su forma numérica (en lugar de sus palabras individuales). A partir de ahí, la estructura utiliza algoritmos para determinar la traducción más probable basándose en el resto de las palabras de esa frase. El decodificador entonces entra en juego para transformar esa representación numérica en las palabras «al gato le gusta comer pizza». ¿En qué se diferencia la TAN?

Si bien la TA estadística también utiliza métodos de sustitución numérica para la traducción, no asigna relaciones entre palabras. Sin embargo, si los datos que se utilizan para entrenar un modelo de TAN muestran un caso de uso similar entre dos palabras, el modelo asignará valores numéricos más cercanos. Por ejemplo, un modelo de TAN puede asignar a las palabras «but» y «except» valores numéricos de 4,12 y 4,16 si los datos muestran un caso de uso similar, de modo que sea más probable que se intercambien. Los modelos de TAN no hacen suposiciones independientes; todos los aspectos de la traducción siempre tienen en cuenta el contexto completo de la frase, incluidas las palabras exactas y el orden en que aparecen. Debido a eso, los sistemas de TAN tienden a mantener más fluidez que otros modelos de traducción automática. ¿Qué es la TA neuronal adaptativa?

La TA neuronal adaptativa es un modelo de TA que se adapta rápidamente a la retroalimentación de los traductores mientras ellos trabajan. «Adaptación» significa que el sistema muy rápidamente puede llegar a ser muy específico para el traductor, lo que hace que parezca más intuitivo. Hay dos tipos comunes de adaptación: la adaptación por lotes (capacitar el modelo con memorias de traducción) y la adaptación en línea (capacitar el modelo con la retroalimentación de los traductores mientras trabajan). El beneficio de un sistema como la TAN adaptativa es que recibe retroalimentación constante de los lingüistas a medida que traducen; además, se actualiza rápidamente y aprende sobre la marcha. Esto significa que no tienes que depender de que el sistema de referencia se vuelva a entrenar, lo cual puede ser costoso y complejo. Debido al costo y a su complejidad, un sistema se vuelve a entrenar con mucha menos frecuencia de lo que debería ser en la práctica. ¿Qué método de traducción es adecuado para mí?

El método de traducción correcto depende de tus necesidades. Ciertos tipos de traducción pueden ser más adecuados para diferentes contenidos. En los casos en los que la velocidad y el costo extremadamente bajo sean más importantes que la calidad, como el contenido generado por los usuarios, la TA pura puede ser suficiente. Para todos los otros casos en que la calidad sea importante, lo mejor es la traducción automática neuronal con humano en el bucle (HITL). Después de todo, el humano en el bucle es el futuro de la TA: combina las ventajas de la traducción automática con la eficiencia y la calidad de los traductores humanos.

Traduce con Lilt hoy mismo