En los últimos años, las estafas virtuales han adoptado nuevas formas impulsadas por tecnologías que permiten replicar de manera precisa características humanas. Entre estas técnicas, la clonación de voz mediante inteligencia artificial se ha convertido en un método creciente para engañar a usuarios y vulnerar su seguridad financiera y personal.
La clonación de voz es una tecnología que utiliza modelos de inteligencia artificial para replicar la forma en que una persona habla. A partir de grabaciones de audio, estos sistemas pueden aprender patrones vocales, entonación, ritmo y timbre, generando imitaciones que pueden ser difíciles de distinguir del original.
Este tipo de herramientas son desarrolladas para usos legítimos, como doblaje automático, asistentes virtuales personalizados o accesibilidad para personas con discapacidades. Sin embargo, también pueden ser utilizadas con fines maliciosos.
Con tan solo unos segundos de grabación, obtenidos de videos publicados en redes sociales, mensajes de voz enviados por aplicaciones de mensajería o incluso llamadas interceptadas, es posible crear réplicas digitales de una voz real.
Estas voces sintéticas pueden ser empleadas en llamadas telefónicas fraudulentas, suplantando la identidad de una persona para engañar a familiares, contactos profesionales o instituciones bancarias.
Según una advertencia emitida en 2023 por la Comisión Federal de Comercio de Estados Unidos (FTC, por sus siglas en inglés), estas estafas se han vuelto más sofisticadas debido a los avances en el entrenamiento de modelos de inteligencia artificial generativa. El organismo sugirió que incluso clips breves de audio disponibles en plataformas públicas pueden ser suficientes para recrear una voz convincente.
Cómo funciona la suplantación con voz artificial
El proceso comienza con la recolección de fragmentos de audio en los que se escucha claramente la voz de la víctima. Estos fragmentos pueden obtenerse de múltiples fuentes, como videos publicados en redes sociales, entrevistas en medios, grabaciones difundidas por aplicaciones de mensajería o plataformas de videoconferencias.
También existen métodos menos evidentes para capturar una muestra de voz. Uno de los más utilizados es realizar una llamada telefónica breve en la que el interlocutor no responde, solo escucha.
En esos casos, la víctima, al insistir o repetir frases como “¿Hola?”, “¿Quién habla?” o “No se escucha”, termina generando el contenido de voz que luego puede ser capturado, grabado y procesado.
Posteriormente, los estafadores utilizan esta voz clonada en contextos manipulativos. En algunos casos, pueden usarla en tiempo real durante una llamada; en otros, se graban mensajes personalizados que se envían a través de plataformas de comunicación.
La calidad de las voces generadas varía según el modelo empleado, pero en muchos casos es suficiente para convencer a quienes conocen a la persona suplantada.
Medidas de prevención
Algunos organismos de protección al consumidor han comenzado a emitir recomendaciones ante el crecimiento de esta modalidad de fraude. Algunas medidas preventivas incluyen:
- Evitar publicar audios o videos personales con voz clara en plataformas públicas.
- Establecer códigos de seguridad con familiares para confirmar la autenticidad de solicitudes urgentes.
- Desconfiar de mensajes o llamadas con tono de urgencia que involucren transferencias de dinero.
- Verificar la información por canales independientes antes de responder a una solicitud sospechosa.
Rol de las plataformas tecnológicas
Diversas compañías tecnológicas que desarrollan herramientas de clonación de voz han comenzado a implementar restricciones para evitar el uso indebido de sus modelos.
Estas medidas incluyen verificaciones de identidad, limitaciones para la exportación de audios generados y mecanismos de detección de uso malicioso. No obstante, existen versiones de código abierto disponibles en línea, lo que complica la regulación y control de estas prácticas.
Si bien no existe una solución definitiva contra la clonación de voz para fines fraudulentos, la concientización sobre esta técnica es una herramienta clave para mitigar su impacto.