Mientras que las inteligencias artificiales (IA) que generan ilustraciones a través de cadenas de texto avanzan y mejoran sus procesos y resultados a pasos agigantados, otro tipo de inteligencias han comenzado a labrar sus caminos. Siempre y cuando exista un resultado al cual llegar, se puede crear una IA que haga todo el trabajo y solo presente el resultado. El concepto ya existía, pero la proliferación de las IA que generan imágenes atrajo la atención de las redes sociales a este interesante mercado.
Pero muy en el fondo existe MoeGoe, desarrollado por CjangCjengh, quien se mantiene en actividad a través de la plataforma GitHub desde julio de este año. Esta inteligencia artificial se ha convertido en tendencia en los foros de comentarios japoneses porque hace algo que quizás muchos esperaban con ansias: crea textos hablados (text-to-speech) usando un repositorio de miles de voces de personajes de anime.
Así es, esta IA permite al usuario escribir un texto y hacer que su personaje favorito de anime lo lea (si es que está disponible entre el repositorio actual, que está en constante expansión). Según los reportes más reciente, el banco de voces de la IA cuenta con alrededor de 2,890 voces registradas a la fecha de redacción de este artículo, que usa como material de aprendizaje continuo (es decir, entre más solicitudes de TTS se hagan, mejor las hace cada vez).
Actualmente es capaz de generar voces en japonés, chino, coreano e inglés, ajustándose a la calidad y tono de voz de cada personaje. Por supuesto, es algo muy similar a lo realizado por Vocaloid con las actrices de voz que contrata para dar vida a sus propios bancos de voces, pero mientras Vocaloid se usa en el ambiente musical, MoeGoe se usa para cualquier cosa imaginable.
Por ejemplo, en el siguiente video se muestra que un usuario uso a todos los personajes disponibles de Princess Connect! Re:Dive y las hizo pedirle perdón a Yui. Con esto podemos comprobar que no solo se escribe un texto y se pone al personaje a hablar, sino que la IA ajusta los tonos y los tiempos por sí sola. Por supuesto, el audio puede parecer poco natural, pero como cualquier IA, se perfecciona entre más solicitudes se le realicen con el tiempo.
En otro video ponen a otros tres personajes de Princess Connect! Re:Dive a decir sus líneas de diálogo originales, pero en chino. Esto demuestra que la IA también ajusta los tonos al nuevo idioma objetivo desde el de origen, ¿abriría esto nuevas puertas en la distribución de novelas visuales? El lector puede notar los cambios al chino cuando nota que los tonos se tornan mucho menos naturales. Sin embargo, la IA sigue perfeccionándose.
También hay otro video en donde ponen a las chicas de Uma Musume: Pretty Derby y Genshin Impact a decir líneas en chino usando su voz original en japonés. Definitivamente una apuesta interesante que podría revolucionar la regionalización de los videojuegos si continúa avanzando por el camino correcto.
Pero el siguiente video es el que nos deja todo absolutamente claro. A partir del segundo 00:58, luego de una presentación sobre la inteligencia artificial, el usuario pone a distintos personajes de anime a decir sus líneas de diálogo originales del japonés en otros idiomas. Esto es lo que nos muestra como la IA maneja el traslado de los tonos, especialmente el del inglés, con el que estamos más familiarizados. ¿Qué se podría lograr con esta herramienta en las manos adecuadas? ¿Quizás simplemente hagan que su personaje favorito les diga “Onii-chan”?
El repositorio de MoeGoe está disponible en GitHub en este enlace, encontrándose actualmente en la versión 3.0.0. Tiene un peso de 173 MB y la interfaz está completamente en chino, por lo que el interesado deberá apoyarse en un traductor si no conoce el idioma.