Base de Datos de Amenazas Vulnerabilidad Vulnerabilidad ChatGPhish en ChatGPT

Vulnerabilidad ChatGPhish en ChatGPT

Investigadores de ciberseguridad han descubierto una vulnerabilidad en ChatGPT de OpenAI que explota la confianza de la plataforma en los enlaces e imágenes de Markdown, lo que permite ataques de inyección instantánea y crea nuevas oportunidades de phishing. Esta técnica, denominada ChatGPhish, demuestra cómo se puede manipular la generación de resúmenes mediante IA para distribuir contenido malicioso directamente a través de una interfaz de confianza.

El problema radica en la forma en que el motor de respuesta de ChatGPT procesa los elementos Markdown provenientes de páginas web de terceros. Cuando el chatbot resume contenido externo, confía automáticamente en los enlaces Markdown incrustados y las URL de imágenes, descargando las imágenes remotas y mostrando los enlaces como elementos activos y clicables dentro de la interfaz del asistente.

La mecánica detrás del ataque

Un atacante puede insertar una pequeña carga maliciosa en una página web, que posteriormente es analizada por ChatGPT. Durante el proceso de renderizado, las imágenes controladas por el atacante pueden ser descargadas automáticamente, lo que podría exponer información como la dirección IP, el agente de usuario y los detalles del referente de la víctima.

Más allá de la fuga de información, la vulnerabilidad permite presentar contenido malicioso de forma muy convincente. Los atacantes pueden insertar enlaces de phishing directamente en las respuestas de ChatGPT, mostrar advertencias de seguridad fraudulentas con apariencia de sistema y presentar códigos QR alojados en infraestructura controlada por el atacante. Estos códigos QR pueden incitar a los usuarios a escanearlos con dispositivos móviles, eludiendo así el filtrado de URL en ordenadores de escritorio y los controles de seguridad empresariales.

Lo que hace que ChatGPhish sea particularmente significativo no es la inyección de mensajes en sí, sino el hecho de que el sistema de IA sigue fielmente las instrucciones integradas y presenta el contenido resultante como parte de un resumen confiable. Por lo tanto, una página web aparentemente común puede generar enlaces de phishing, alertas de cuentas falsas, imágenes remotas y códigos QR maliciosos directamente en la respuesta de un asistente de IA.

La creciente superficie de amenazas de la navegación asistida por IA

Este descubrimiento pone de relieve un desafío de seguridad más amplio: la generación de resúmenes se ha convertido en una nueva superficie de ataque. A principios de marzo de 2026, investigadores demostraron que correos electrónicos especialmente diseñados podían manipular Microsoft Copilot mediante la inyección de comandos entre ventanas (XPIA), influyendo en los resúmenes generados por IA a través de instrucciones ocultas.

A medida que las organizaciones dependen cada vez más de las herramientas de IA para la investigación y el análisis de contenido, cualquier página web maliciosa procesada por un asistente de IA puede introducir instrucciones controladas por el atacante en el contexto del modelo. Esto representa un cambio importante en las tácticas de phishing. En lugar de exigir a los usuarios que abran archivos adjuntos sospechosos o interactúen con correos electrónicos maliciosos, los atacantes pueden utilizar como arma la actividad de navegación rutinaria y los flujos de trabajo de resumen de IA.

La migración de los ataques desde los entornos de correo electrónico a las interacciones de IA basadas en navegadores amplía drásticamente la superficie de ataque disponible. Basta con solicitar un resumen de una página web para exponer a los usuarios a contenido malicioso generado mediante técnicas de inyección indirecta de mensajes.

Una creciente ola de técnicas para eludir la seguridad de la IA

La revelación de ChatGPhish se produce en medio de una oleada de investigaciones que revelan nuevos métodos de ataque dirigidos a sistemas de inteligencia artificial. Entre los hallazgos recientes se incluyen:

  • La técnica de jailbreak Involuntary In-Context Learning (IICL), que explota los conflictos entre el aprendizaje en contexto y la alineación de seguridad para eludir las restricciones de GPT-5.4; estrategias de conversación de múltiples turnos que eluden gradualmente las salvaguardas de los grandes modelos de lenguaje; ataques de inyección de indicaciones tipográficas que ocultan instrucciones dentro de imágenes visualmente distorsionadas; ataques Neural Exec combinados con técnicas de anulación de Unicode de derecha a izquierda para eludir las protecciones de Apple Intelligence; y WebPromptTrap, una vulnerabilidad de inyección indirecta de indicaciones que afecta a BrowserOS y que manipulaba a los usuarios a través de resúmenes generados por IA de contenido aparentemente legítimo.
  • Debilidades de seguridad que afectan a los ecosistemas de IA y a los marcos de agentes, incluida una vulnerabilidad en Anthropic Claude Code que permitía la interceptación de comunicaciones MCP respaldadas por OAuth a través de un paquete npm malicioso; un escenario de abuso del mecanismo de actualización remota dirigido a las habilidades de OpenClaw; campañas de phishing de texto oculto diseñadas para engañar a los productos de seguridad de correo electrónico impulsados por IA; la vulnerabilidad ClaudeBleed que permitía a las extensiones del navegador emitir comandos no autorizados a Claude; vulnerabilidades críticas en Microsoft Semantic Kernel (CVE-2026-25592 y CVE-2026-26030) capaces de escalar las inyecciones de avisos a la ejecución remota de código a nivel de host; fallos de seguridad generalizados dentro de los repositorios de agentes ClawHub y skills.sh; y ataques contra la pila de referencia NemoClaw de NVIDIA que permitían la exfiltración de datos de OpenClaw a través de repositorios GitHub maliciosos y paquetes npm.

El futuro de las ciberamenazas impulsadas por la IA

A medida que los modelos avanzados de IA siguen madurando, los ciberdelincuentes experimentan cada vez más con sus capacidades ofensivas. Los ciberdelincuentes utilizan grandes modelos de lenguaje para desarrollar malware más adaptable, capaz de modificar su comportamiento para evadir los mecanismos de detección.

Además, se están incorporando sistemas de IA a los procesos de toma de decisiones del malware. Estas capacidades permiten que el software malicioso evalúe los entornos comprometidos, determine si los objetivos son valiosos y decida si las condiciones son adecuadas para desplegar cargas útiles adicionales.

La investigación de ChatGPhish sirve como recordatorio de que las tecnologías de IA introducen consideraciones de seguridad completamente nuevas. A medida que los asistentes de IA se integran profundamente en los flujos de trabajo empresariales, la protección contra inyecciones indirectas de mensajes, resúmenes manipulados y abusos de interfaces basadas en la confianza se convertirá en un componente cada vez más crítico de la estrategia de ciberseguridad.

Tendencias

Mas Visto

Cargando...