Desarrollo de motor personalizado vs. ajuste fino de LLM / aprendizaje en contexto para traducir contenido

by Lilt  Han Mai, Associate Director, Demand Generation  ·  IA

Con tantas tecnologías y herramientas de IA nuevas que están surgiendo en el mercado, puede ser difícil para los clientes de traducción o localización empresariales entender las diferencias entre el desarrollo de motores personalizados y el ajuste de los LLM para tipos de contenido específicos (por ejemplo, copia de marketing, contratos legales, descripciones de productos de comercio electrónico).  Esta publicación de blog proporcionará una mejor comprensión de estos dos enfoques y explicará cómo el aprendizaje en contexto (ICL) se puede usar para mejorar la exactitud y la eficiencia de la traducción.

Desarrollo de motor personalizado vs. entrenamiento de motor adaptativo

Cuando se trata de la traducción automática, dos de los enfoques más populares son el desarrollo de motores personalizado y el entrenamiento adaptativo del motor.  Si bien ambos enfoques tienen sus propias ventajas y desafíos únicos, la diferencia entre el entrenamiento personalizado del motor y el ajuste de los LLM radica en cómo se ajustan los parámetros del modelo para adaptarse mejor a tipos de contenido específicos.  El desarrollo de motores personalizados implica crear un nuevo sistema desde cero, mientras que el ajuste de LLM se centra en entrenar a los modelos existentes para reconocer y responder a tipos específicos de contenido.

Desarrollo de motor personalizado

El desarrollo de motores personalizados es el proceso de entrenar los parámetros de un modelo una vez que se usa un conjunto de datos específico de contenido e implementa esos parámetros.  En el pasado, el enfoque estándar para la traducción era desarrollar un motor personalizado para cada tipo de contenido.  Esto implicó recopilar un gran conjunto de datos de pares de texto de origen y destino para el tipo de contenido específico y luego entrenar un modelo de traducción automática sobre estos datos.  Una vez que el modelo fue entrenado, podría implementarse para traducir nuevo texto.

Este enfoque se ha utilizado durante muchas décadas y puede producir modelos de alta exactitud.  Sin embargo, también es un proceso costoso y que consume mucho tiempo.  Puede llevar meses o incluso años recopilar suficientes datos y entrenar un modelo de alta calidad.  Además, los motores personalizados no siempre pueden mantenerse al día con los últimos cambios en el idioma.  Esto se debe a que están entrenados con un conjunto de datos estáticos de datos, que pueden quedar obsoletos con el tiempo.  Si una empresa quiere entrenar el modelo en un nuevo ejemplo, debe volver a entrenar todo el modelo e implementarlo de nuevo, lo que puede ser un proceso tedioso y lento y conducir a modelos obsoletos.

Capacitación adaptativa del motor

Por otro lado, el entrenamiento adaptativo del motor es un enfoque más nuevo de la traducción que aborda algunas de las limitaciones del desarrollo de motores personalizados e implica actualizar continuamente los parámetros del modelo implementado con un flujo constante de nuevos ejemplos de entrenamiento.  Este enfoque elimina la necesidad de reentrenar y reimplementar todo el modelo, lo que garantiza que el modelo siempre esté entrenado con los datos más recientes y mejore su exactitud a lo largo del tiempo.  LILT fue pionera y comenzó a desarrollar esta tecnología en 2015, revolucionando la forma en que las empresas abordan la traducción empresarial.

El entrenamiento adaptativo del motor es más eficiente que el desarrollo personalizado del motor, pero aún no es tan eficiente como el aprendizaje en contexto.  Esto se debe a que el entrenamiento adaptativo del motor requiere una gran cantidad de datos para entrenar el modelo.

Dónde estamos ahora con el aprendizaje en contexto / ajuste de LLM

El aprendizaje en contexto o ajuste de precisión de LLM lleva el enfoque de entrenamiento adaptativo del motor aún más al permitir la personalización rápida de un solo modelo a un tipo de contenido específico.  Con el aprendizaje en contexto, un modelo de traducción automática se entrena en un solo ejemplo del tipo de contenido que se va a traducir.  Esto permite que el modelo se personalice para el tipo de contenido específico sin la necesidad de un gran conjunto de datos de entrenamiento.

En los últimos años, el aprendizaje en contexto o el ajuste fino de LLM se ha convertido en el enfoque preferido para lograr exactitud y eficiencia en la traducción.  Este enfoque permite el entrenamiento continuo de un modelo implementado y comprende dos técnicas: ajuste fino y indicaciones de pocos disparos.

Ajuste preciso

El ajuste fino es el proceso de ajustar los parámetros del modelo para cada nuevo ejemplo.  Es una técnica específica para las redes neuronales que ajusta los parámetros del modelo para cada nuevo ejemplo, lo que lleva a una exactitud aún mayor.

Indicación de pocos disparos

La indicación de pocos disparos implica agregar ejemplos de entrenamiento a la entrada del modelo implementado para influir en el resultado del modelo sin ajustar sus parámetros.

Una de las mayores ventajas del ajuste de ICL y LLM es que elimina la necesidad de múltiples evaluaciones de modelos.  Con un solo modelo, el ICL permite la rápida personalización de modelos para tipos de contenido específicos, lo que resulta en una exactitud y eficiencia aún mayores.

Dicho esto, el aprendizaje en contexto es el enfoque más eficiente y preciso para la traducción.  Es un enfoque más nuevo, pero se está convirtiendo rápidamente en el estándar para la traducción.

Consideraciones finales: elegir el enfoque adecuado para tu negocio

Al igual que con cualquier tecnología, no hay una solución única para todos cuando se trata del desarrollo de motores personalizados frente al ajuste de LLM.  El enfoque que elijas debe adaptarse a tus necesidades específicas, presupuesto y cronograma.  Al considerar cuidadosamente estos factores, puedes elegir el enfoque que ofrecerá los mejores resultados para tu empresa.

Considera los recursos que tienes disponibles para ti.  El desarrollo de motores a medida requiere una inversión significativa de tiempo, dinero y experiencia.  Si no tienes estos recursos o si tu contenido está en constante evolución, el ajuste de LLM puede ser una solución más práctica para tu negocio.

Por último, considera tus objetivos a largo plazo.  Si planeas escalar tus esfuerzos de traducción y agregar nuevos tipos de contenido en el futuro, un motor personalizado puede ser una mejor inversión.  Sin embargo, si estás buscando una solución más flexible que pueda adaptarse a las necesidades de contenido cambiantes, el ajuste de los LLM puede ser el camino a seguir.

Si bien tanto el entrenamiento personalizado del motor como el entrenamiento adaptativo del motor pueden producir modelos de alta exactitud, el ICL permite la personalización y el entrenamiento continuo, lo que conduce a mejores resultados para tipos de contenido específicos y lo que lo convierte en el enfoque preferido para muchas empresas.  En última instancia, el enfoque adecuado para tu negocio dependerá de tus necesidades y requisitos específicos.