N.º 2581 – Discurso2Cara
15 de abril de 2022 por Craig Shames
Es posible que pronto sea posible que la IA determine cómo se ve en función de su sonido. Un truco que podría ayudar a la policía a identificar a los sospechosos o permitir que la gente común como tú y yo pongamos cara a una voz y no solo un nombre.
Me gusta Petapixel el plato:
“Las fotografías se hacen con luz, pero ¿y si los retratos de personas se pudieran hacer con el sonido de su voz? Los investigadores de IA han trabajado en la reconstrucción del rostro de una persona utilizando solo una breve grabación de audio de esa persona hablando, y los resultados son inquietantemente impresionantes.
¡¿Pero como funciona?!
“Los investigadores primero diseñaron y entrenaron una red neuronal profunda utilizando millones de videos de YouTube e Internet que mostraban a personas hablando. Durante este entrenamiento, la IA aprendió las correlaciones entre el sonido de las voces y la apariencia del hablante. Estas correlaciones le permitieron hacer las mejores conjeturas sobre la edad, el género y el origen étnico del hablante.
No hubo participación humana en el proceso de entrenamiento, ya que los investigadores no necesitaron etiquetar manualmente subconjuntos de datos: la IA simplemente recibió una gran cantidad de video y cargó para determinar las correlaciones entre las características vocales y las características faciales.
Una vez entrenada, la IA fue notablemente buena para crear retratos basados únicamente en grabaciones de voz que se asemejaban a la apariencia real del hablante.
Echa un vistazo por ti mismo para ver qué tan preciso es:
No se puede negar que esta tecnología es realmente impresionante. Pero ¿es realmente necesario? Si quieres saber cómo me veo, solo pregunta. Seré el primero en decirte que soy un Adonis.
¿Es Speech2Face la mejor idea de todos los tiempos?
Así:
Me gusta cargar…
Relacionada
Publicado en Tecnología | Deja un comentario