OpenAI lanza Lockdown Mode en ChatGPT para frenar la exfiltración de datos por inyección de prompts

0 0 votos

Valora la Publicación

OpenAI lanzó un Lockdown Mode (modo de bloqueo) para ChatGPT, una función opcional que restringe la capacidad del asistente de interactuar con servicios externos para reducir el riesgo de exfiltración de datos por inyección de prompts. Junto con él, la compañía introdujo etiquetas de «riesgo elevado» para advertir sobre acciones sensibles. La función está pensada para quienes manejan información crítica, no para el usuario promedio.

Qué hace el Lockdown Mode

El modo recorta justamente las capacidades que un atacante podría usar para sacar datos del entorno del usuario. Con Lockdown Mode activo, ChatGPT deshabilita la navegación web en vivo (solo accede a contenido cacheado), la recuperación de imágenes desde internet, el Deep Research, el modo Agente, los conectores con servicios externos y la descarga de archivos para análisis. Se mantienen, en cambio, funciones como la memoria, la subida manual de archivos y la generación de imágenes.

La lógica es simple: la inyección de prompts es una técnica de ingeniería social en la que instrucciones maliciosas, escondidas en una página, un PDF o un archivo, manipulan al modelo para que haga algo que el usuario no pidió —típicamente, mandar datos sensibles a un servidor del atacante—. Si se cierran los canales de salida hacia la red, ese vector se achica.

Cómo se activa y para quién es

Lockdown Mode se habilita desde la configuración de ChatGPT, en la sección de seguridad, y puede desactivarse temporalmente por conversación. Está disponible en distintos planes, desde cuentas gratuitas hasta workspaces empresariales gestionados. OpenAI es explícita en el encuadre: «no está pensado para todos», sino para personas y organizaciones que manejan datos sensibles y quieren una protección más estricta.

No es una solución definitiva

La propia compañía aclara los límites: el modo no impide que una inyección de prompt aparezca en el contenido que ChatGPT procesa —puede estar en una página cacheada o en un archivo subido— y no garantiza protección completa. Queda riesgo residual a través de apps de terceros habilitadas, combinaciones imprevistas de capacidades y técnicas de explotación nuevas. Es una medida que reduce la superficie de ataque, no que la elimina.

El movimiento se entiende en el contexto de 2026: la inyección de prompts encabeza el OWASP Top 10 para aplicaciones con LLM por tercer año consecutivo, y el problema se agravó con la IA agéntica y los conectores tipo MCP, que le dan a los modelos la capacidad de actuar sobre sistemas reales. Un caso reciente —un complemento de IA para Google Sheets que, vía inyección, podía exfiltrar planillas enteras— mostró que el riesgo es de todos los días, no teórico.

El nuevo perímetro es el asistente

Que OpenAI tenga que ofrecer un «modo de bloqueo» dice mucho de hacia dónde fue la seguridad: el asistente de IA conectado a tus datos y a tus herramientas es, hoy, un punto de entrada que hay que defender como cualquier otro. ¿Usás conectores o modo agéntico con datos sensibles en tu organización, o todavía mantenés a la IA en una caja separada? Te leemos en los comentarios.

Fuentes

Escrito por

Pablo Ariel Di Loreto

Profesor. Informático. Fanático del helado de dulce de leche. Director de Ingeniería en MODO, y Secretario del Microsoft Users Group Asociación Civil. Además, soy owner de iniciativas como ConoSurTech y Aprender IT.

Ver todas las entradas de Pablo Ariel Di Loreto →