Pindrop afirma detectar deepfakes de audio generados por IA con un 99% de precisión
Pulse Inspect, una herramienta web lanzada por Pindrop, una empresa especializada en seguridad vocal, verificación de identidad y detección de fraude, promete detectar speech generado por IA en cualquier archivo de audio o video digital con una precisión significativamente alta: 99%.
Esta característica forma parte de la suite de productos Pulse de Pindrop y ofrece detección independientemente de la herramienta o modelo de IA desde la que se haya generado el audio.
En un movimiento ambicioso y destacado en la práctica general de la industria, donde los proveedores de IA lanzan clasificadores de IA solo para detectar contenido sintético generado por sus herramientas, Pindrop ofrece Pulse Inspect en una suscripción anual para organizaciones que buscan combatir el riesgo de deepfakes de audio a gran escala.
El CEO de Pindrop, Vijay Balasubramaniyan, menciona que podrían lanzar opciones de precios más asequibles en el futuro para usuarios ocasionales, dependiendo de la demanda del mercado.
El problema de los deepfakes de audio ha ido en aumento con la proliferación de sistemas generativos de IA basados en texto en internet. Herramientas de IA populares, como las de Microsoft y ElevenLabs, han sido utilizadas para imitar el audio y video de celebridades, empresarios y políticos con el fin de difundir desinformación y estafas, afectando su imagen pública.
Según un informe interno de Pindrop, más de 12 millones de adultos estadounidenses conocen a alguien a quien le han creado deepfakes sin su consentimiento. Estas duplicaciones pueden ser desde imágenes hasta videos y audio, pero todas tienen en común su rápida propagación en redes sociales.
Para abordar este problema en constante evolución, Pindrop presentó la suite de productos Pulse este año. El primer servicio en el portafolio ayudaba a las empresas a detectar llamadas de deepfakes que llegaban a sus centros de llamadas. Con Pulse Inspect, la compañía va más allá, permitiendo a las organizaciones verificar cualquier archivo de audio/video en busca de artefactos sintéticos generados por IA.
El proceso de verificación de artefactos sintéticos en archivos multimedia existentes solía requerir una exhaustiva examinación forense. Sin embargo, con esta herramienta, el sistema procesa el audio en cuestión de segundos y proporciona un «puntaje de deepfake», con secciones que contienen speech generado por IA.
Este rápido tiempo de respuesta permite a las organizaciones tomar medidas proactivas para prevenir la difusión de desinformación y mantener la credibilidad de su marca.
Pindrop ha entrenado un modelo de detección de deepfakes propietario en más de 350 herramientas de generación de deepfakes, 20 millones de enunciados únicos y más de 40 idiomas, logrando una tasa de detección de deepfakes de audio del 99% basada en su análisis interno de un conjunto de datos de aproximadamente 200 mil muestras.
Actualmente, Pindrop está dirigido a organizaciones como compañías de medios, organizaciones sin fines de lucro, agencias gubernamentales, firmas de gestión de celebridades, despachos de abogados y redes sociales. Balasubramaniyan no reveló el número exacto de clientes que utilizan la herramienta, pero mencionó que varios socios la están usando mediante una suscripción anual basada en volumen.
Además de admitir cargas manuales a través de la aplicación web, Pulse Inspect también puede integrarse en flujos de trabajo forenses personalizados a través de una API, lo que puede potenciar casos de uso a granel, como el de una red social que detecta y elimina videos dañinos generados por IA.
En el futuro, Pindrop tiene planeado fortalecer la suite Pulse mejorando el aspecto de explicabilidad de las herramientas, con una función para rastrear el origen de las generaciones de deepfakes, y soportando más modalidades.
GIPHY App Key not set. Please check settings