Microsoft lanza VALL-E, IA que puede replicar tu voz – Review Geek

Volodymyr Kyrylyuk/Shutterstock.com

El arte generado por IA está apareciendo en todas partes, pero eso es solo el comienzo. Microsoft lanzó recientemente una nueva herramienta de inteligencia artificial llamada VALL-E, que es similar a DALL-E pero para voces. Después de escuchar solo tres segundos de audio, VALL-E puede replicar cualquier voz.

Si eso suena aterrador, es porque lo es. Eso no es todo, tampoco. De acuerdo a AITemas, la nueva herramienta de Microsoft combina fácilmente la emoción y el tono, algo con lo que luchan muchas herramientas de IA de voz. El equipo entrenó a VALL-E con aproximadamente 60 000 horas de datos de habla en inglés y demostró habilidades de aprendizaje en contexto e incluso pudo replicar palabras que nunca había escuchado.

El informe dice que VALL-E es capaz de TTS basado en avisos, sigue el contexto y no necesita una acústica prediseñada ni ninguna ingeniería estructural para ofrecer una muestra de audio de alta calidad. Básicamente, esta nueva herramienta de IA es bastante impresionante. Todo lo que VALL-E necesita es escuchar unos tres segundos de cualquier voz, y podrá imitar (o replicar) la voz rápida y fácilmente.

Hay varios ejemplos de audio de la herramienta en GitHub, y aunque algunos suenan muy bien, otros no son tan impresionantes y tienen un tono robótico. Pero cuando funciona, funciona muy bien. Dicho esto, estos son todavía los primeros días de VALL-E, y las cosas mejorarán con el tiempo. Además, si el equipo usara muestras más grandes, probablemente sería más preciso.

Es importante señalar que VALL-E no está disponible para el público, al menos no todavía, por lo que todos podemos dejar escapar un suspiro de alivio. Si eso sucede, sin duda habrá una gran cantidad de preocupaciones de seguridad, sociales y éticas, por decir lo menos. Si bien esta tecnología ciertamente suena impresionante, también es bastante salvaje.

a través de Windows Central

Descubre más contenido

Subir Change privacy settings