Colabora

Las voces generadas por la IA aumentan la simpatía y la fiabilidad de las voces humanas

Este efecto tiene implicaciones significativas en la personalización de tecnologías de voz.

Inteligencia Artificial ayuda a tu empresa. | LD/Agencias

La inteligencia artificial —IA— ha avanzado hasta permitir la creación de voces sintéticas que imitan a personas reales con gran precisión. Esta capacidad tiene múltiples aplicaciones, desde asistentes de voz personalizados hasta la generación de deep fakes, lo que plantea riesgos de manipulación y desinformación. Este estudio examinó cómo la similitud vocal influye en la confianza y la simpatía, así como la validez de las métricas de IA para predecir juicios humanos de similitud de voz.

Para ello, se realizaron cinco experimentos con participantes humanos y un sistema de reconocimiento de hablantes basado en d-vectores. Estos son representaciones numéricas de voces generadas por redes neuronales profundas, utilizadas en autenticación de identidad y clonación de voz con pocos segundos de audio.

Los resultados de los primeros tres experimentos confirmaron que la similitud de voz calculada por IA se correlaciona con la percepción humana. Se encontró una relación cuadrática, donde las voces extremadamente similares o disímiles eran más fáciles de identificar, mientras que las intermedias resultaban más difíciles de evaluar. También se observó que los participantes eran menos propensos a percibir otras voces como similares a la suya, lo que podría deberse a la necesidad de sentirse únicos o a una mayor sensibilidad a las diferencias en su propia voz.

Voces familiares

El cuarto experimento exploró si las voces promedio eran percibidas como más confiables o agradables, siguiendo la teoría de la "belleza en la media" observada en rostros. Sin embargo, no se encontró evidencia de que las voces promedio fueran preferidas, lo que sugiere que este fenómeno puede no aplicarse en el ámbito auditivo.

El quinto experimento reveló un hallazgo clave: las voces similares a la del oyente eran percibidas como más confiables y agradables. Esto respalda la hipótesis de la atracción por la similitud, donde las personas tienden a preferir a quienes comparten características con ellas. Este efecto tiene implicaciones significativas en la personalización de tecnologías de voz, ya que asistentes virtuales o mensajes persuasivos podrían ser diseñados para imitar sutilmente la voz del usuario, aumentando su impacto.

El estudio destaca el riesgo de manipulación mediante la clonación de voces, dado que la IA permite generar voces realistas con muestras mínimas. En contextos políticos, comerciales o fraudulentos, esto podría usarse para influir en la opinión pública o engañar a individuos. Además, el hallazgo de que la similitud vocal aumenta la confianza sugiere que esta tecnología podría aprovecharse para generar contenido persuasivo sin que los usuarios sean conscientes.

Con el avance de los asistentes de voz y los deep fakes, comprender el impacto de la similitud vocal en la confianza y la percepción social será fundamental para el desarrollo responsable de la inteligencia artificial.

Temas

Ver los comentarios Ocultar los comentarios

Portada

Suscríbete a nuestro boletín diario