La violación de seguridad de DeepSeek expone vulnerabilidades de inteligencia artificial y desencadena ciberataques

El último modelo de inteligencia artificial generativa de China, DeepSeek, ha sido objeto de un intenso escrutinio en materia de ciberseguridad desde su lanzamiento. Recientemente, los investigadores de seguridad expusieron un jailbreak del sistema que reveló el funcionamiento interno del modelo. Mientras tanto, DeepSeek también se ha enfrentado a oleadas de ataques DDoS, lo que lo ha obligado a restringir el registro de nuevos usuarios. Estos incidentes ponen de relieve tanto los riesgos de seguridad de los modelos de IA como la creciente sofisticación de los ciberataques dirigidos contra los servicios de IA.
Tabla de contenido
El sistema DeepSeek con jailbreak: lo que descubrieron los investigadores
Poco después del debut de DeepSeek, los investigadores de la empresa de seguridad de API Wallarm encontraron una vulnerabilidad de jailbreak que exponía el mensaje de sistema completo del modelo de IA. Este tipo de falla de seguridad es particularmente preocupante porque el mensaje de sistema de una IA dicta su comportamiento, limitaciones de respuesta y políticas de moderación de contenido. La mayoría de los desarrolladores de IA, incluido OpenAI con ChatGPT, toman medidas estrictas para evitar este tipo de filtraciones.
Wallarm afirmó en una publicación de blog del 1 de febrero que su método de jailbreak explotaba la lógica de respuesta de la IA basada en sesgos, aunque la empresa retuvo detalles técnicos específicos debido a políticas de divulgación responsable. DeepSeek fue notificado del problema y desde entonces ha implementado una solución. Sin embargo, Wallarm publicó el texto completo del aviso del sistema, lo que permitió a los expertos en seguridad analizar el marco operativo de DeepSeek.
Esta revelación provocó debates sobre:
- Medidas de privacidad de la IA y con qué eficacia DeepSeek protege los datos de los usuarios.
- Posibles sesgos en el entrenamiento de DeepSeek, especialmente considerando las afirmaciones de que puede haber utilizado datos de OpenAI para el entrenamiento.
- Restricciones regulatorias que podrían influir en el funcionamiento del modelo de IA, particularmente en China, donde el contenido de IA está estrictamente controlado.
Para investigar la posible influencia de OpenAI, Wallarm comparó el mensaje del sistema de DeepSeek con el de ChatGPT. Según el análisis de ChatGPT, las respuestas de DeepSeek se ajustan a medidas de cumplimiento más estrictas, mientras que el enfoque de OpenAI es más flexible y centrado en el usuario.
Ataques DDoS a DeepSeek: un ciberataque coordinado
A medida que la popularidad de DeepSeek fue creciendo, se convirtió en el objetivo de ataques de denegación de servicio distribuidos (DDoS) a gran escala. La empresa anunció que tuvo que bloquear el registro de nuevos usuarios debido al abrumador volumen de ataques.
Según NSFocus, una empresa de ciberseguridad que monitorea los ataques, DeepSeek enfrentó tres grandes oleadas de ataques DDoS dirigidos contra su interfaz API el 25, 26 y 27 de enero. Cada ataque duró alrededor de 35 minutos y afectó gravemente a la plataforma de DeepSeek. Para el 28 de enero, la interfaz API todavía no estaba disponible debido a las interrupciones en curso.
El sistema de chat DeepSeek también fue atacado, y se observaron ataques DDoS el 20 y el 25 de enero, cada uno de los cuales duró aproximadamente una hora.
Métodos de ataque DDoS
NSFocus identificó múltiples técnicas de ataque basadas en la reflexión, entre ellas:
- Ataques de reflexión NTP : explotación de servidores de Protocolo de tiempo de red (NTP) para amplificar el tráfico de ataque.
- Ataques de reflexión de Memcached : uso de servidores Memcached mal configurados para inundar DeepSeek con tráfico masivo.
- Ataques de reflexión SSDP : tienen como objetivo los servicios del Protocolo simple de descubrimiento de servicios (SSDP) para saturar los recursos de la red.
- Ataques de reflexión CLDAP : uso de servidores de Protocolo ligero de acceso a directorios sin conexión (CLDAP) para aumentar el volumen de ataques.
Un ataque altamente coordinado
El 28 de enero, DeepSeek informó que los atacantes estaban adaptando sus métodos en respuesta a los esfuerzos de mitigación de la empresa. La precisión y coordinación de estos ataques llevaron a NSFocus a concluir que los perpetradores eran un equipo profesional y bien organizado, y no piratas informáticos aleatorios.
“El atacante demuestra un profesionalismo extremadamente alto en cada paso del ataque, desde la selección de objetivos hasta la sincronización de los ataques y el control de la intensidad”, afirmó NSFocus.
Las principales fuentes de ataques incluyeron sistemas de Estados Unidos, el Reino Unido y Australia, según el análisis de la empresa de ciberseguridad.
Qué significa esto para la seguridad de la IA
Los incidentes de DeepSeek ponen de relieve los crecientes riesgos de ciberseguridad en la IA generativa. Desde vulnerabilidades de jailbreak hasta ciberataques dirigidos, los servicios de IA son ahora objetivos principales tanto para investigadores de seguridad como para actores maliciosos.
Conclusiones clave:
- Los jailbreaks de IA siguen siendo un desafío de seguridad : incluso los modelos de IA más nuevos, como DeepSeek, pueden ser sometidos a ingeniería inversa para exponer su lógica interna.
- Los ataques DDoS contra plataformas de IA están aumentando : a medida que los servicios de IA ganan popularidad, atraen ciberataques más coordinados.
- La seguridad de la IA debe evolucionar rápidamente : los desarrolladores deben implementar medidas de seguridad sólidas para evitar filtraciones rápidas y defenderse de las amenazas cibernéticas.
A medida que la IA continúa dando forma al panorama digital, los equipos de ciberseguridad deben estar un paso adelante para garantizar que los modelos de IA sigan siendo seguros y resilientes frente a las amenazas emergentes.