Pilar Gil Adrados

Entre Encinas

Pilar Gil Adrados


Babel

30/01/2025

Hace unos días, por los mentideros corría como la pólvora -¡no era para menos!- la noticia de que META ha logrado diseñar, mediante inteligencia artificial, un modelo avanzado de traductor multimodal que no solo permite la traducción del texto en voz y la traducción de la voz a un texto, sino que iría más allá de la interpretación simultánea, puesto que es capaz de traducir de manera instantánea conversaciones de voz a voz, permitiéndonos mantener el dialogo con aquellos que nos hablan en un idioma que no conocemos.
Bueno, por el momento, no con todos con quien no nos entendamos, puesto que, aunque en la actualidad hay alrededor de 7000 lenguas en el mundo (más de 200 en Europa), este modelo, llamado SeamlessM4T, solo emplea 101 idiomas de origen, puede generar texto traducido a 96 idiomas y facilitar la traducción hablada en 35. Aun así, es un verdadero logro con el que se cumpliría uno de los ansiados sueños del ser humano, al facilitarnos la comunicación y hacer que las barreras lingüísticas sean menos insalvables. Además, en principio, parece que será mucho más fácil, no se si energéticamente más eficiente, que aprender el Esperanto, que ha conseguido reunir a más de dos millones de hablantes y celebra un congreso mundial sin interpretes desde 1905, en Tanzania el pasado año.
El 15 de enero, la revista Nature publicó un artículo del equipo de SeamlessM4T, presentando el modelo como una herramienta que ayudará a las personas a traducir el habla entre dos idiomas, gracias a la innovación tecnológica y la experiencia lingüística,  haciendo referencia al famoso pez Babel, una especie ficticia creada por Douglas Adams en Guía del autoestopista galáctico, que alojado en el oído se alimenta de todo lo que dicen alrededor y lo excreta en forma de traducción para su hospedador.
Hasta ahora, la mayoría de los traductores automáticos traducen de un idioma a otro, empleando una lengua intermedia de la que se tenga mucha información para poder entrenarlos (machine learning). Algo así como funciona la interpretación en el Parlamento Europeo, donde se emplean 24 idiomas oficiales, pasando previamente por el inglés o el francés, lo que conlleva a cometer errores de traducción con mayor probabilidad y a que se reciba la interpretación de algunas lenguas con retardo. SeamlessM4T propone la traducción directa convirtiendo previamente el lenguaje en vectores matemático que pueden procesar las máquinas.
Sin embargo, no podemos esperar que se haya conseguido la traducción automática de una conversación, puesto que hay muchos detalles por resolver. Como se señala en el artículo, para la comunicación oral se necesita mucha más inmediatez que en el lenguaje escrito y los hablantes que empleen esta herramienta tienen poca capacidad para determinar la calidad del resultado o para reeditarlo para su revisión y no cometer errores perjudiciales, a diferencia de la traducción de un texto para el que se recurre a la traducción inversa o a la ayuda de un hablante nativo. 
Por eso, habría que entenderlo como un apoyo y no como el sustituto del aprendizaje de idiomas o de los intérpretes humanos, siempre más fiables.