Anthropic publicó el primer balance de Project Glasswing y los números son contundentes: su inteligencia artificial detectó más de 10.000 vulnerabilidades de severidad alta o crítica en software clave de internet, en apenas un mes.
Glasswing es una iniciativa que Anthropic lanzó en abril de 2026 junto a unos 50 socios, con un objetivo concreto: encontrar y corregir vulnerabilidades en software crítico antes de que los propios modelos de IA puedan explotarlas. El 22 de mayo la empresa compartió los primeros resultados, y muestran a la IA trabajando del lado de la defensa a una escala que hasta hace poco era impensada.
Los números del primer mes
El motor detrás del programa es Claude Mythos, que realiza escaneo automático de código, detección de fallas y hasta desarrollo de exploits de prueba para demostrar el impacto real de cada vulnerabilidad. Estos son los datos que reportó Anthropic:
- +10.000 vulnerabilidades de severidad alta o crítica halladas en el primer mes en los sistemas de los socios.
- 6.202 fallas alta/crítica identificadas en más de 1.000 proyectos open source (sobre 23.019 vulnerabilidades totales analizadas).
- De 1.752 vulnerabilidades evaluadas a fondo, el 90,6% se confirmó como válida y el 62,4% como de severidad alta o crítica — es decir, pocos falsos positivos.
- Los socios reportaron aumentos de hasta 10x en su tasa de detección de bugs. Cloudflare, por ejemplo, encontró 2.000 fallas, 400 de ellas alta/crítica.
Entre el software analizado aparecen piezas que sostienen buena parte de internet, como el navegador Firefox y la librería criptográfica wolfSSL, además de otros componentes de infraestructura esencial.
Las vulnerabilidades más resonantes (las que ya salieron a la luz)
Por la política de divulgación coordinada, Anthropic todavía no dio el detalle de la mayoría de las 10.000 fallas: cada una se publica recién cuando el parche está ampliamente desplegado, así que por ahora solo un puñado tiene CVE pública. Pero las que ya se conocen alcanzan para dimensionar el calibre (con su registro oficial donde está disponible):
- CVE-2026-5194 — wolfSSL (crítica). Falla de falsificación de certificados en una librería criptográfica presente en más de 5.000 millones de dispositivos. Mythos llegó a construir un exploit que permitía montar el sitio de un banco o un proveedor de correo —perfectamente legítimo a la vista del usuario— pero controlado por el atacante. Ya está parcheada.
- CVE-2026-4747 — FreeBSD (ejecución remota de código). Permite correr código en el sistema operativo de forma remota. Es la única CVE pública atribuida directamente a Glasswing hasta ahora.
- Firefox 150 — 271 vulnerabilidades corregidas. Mozilla halló y arregló más de diez veces las que había encontrado en Firefox 148. De las 40 CVEs públicas vinculadas al programa, 28 están en Firefox (ver avisos de seguridad de Mozilla).
- wolfSSL — 9 CVEs en total dentro de esas 40 públicas, además de la crítica ya mencionada.
- F5 NGINX Plus y OpenSSL — 1 CVE cada uno. Dos piezas que sostienen millones de servidores web y conexiones cifradas en todo el mundo.
- Cloudflare — 2.000 bugs (400 alta/crítica). La mayor cosecha individual reportada por un socio del programa (según el informe de Anthropic).
- Sector bancario — fraude de US$ 1,5 millones frenado. No fue una falla de software sino un caso de uso defensivo: Mythos detectó y detuvo una transferencia fraudulenta tras un compromiso de correo.
Conviene tomar el dato con perspectiva: el número de 10.000 es una estimación de Anthropic y la atribución de CVEs todavía genera debate — algunos analistas piden cautela con el conteo hasta que se publiquen los detalles técnicos de cada caso (ver el seguimiento de VulnCheck y el análisis de The Register). Lo que no está en discusión es la escala del fenómeno.
Quiénes participan y cómo se divulga
La lista de socios incluye nombres de peso: Cloudflare, Mozilla, Palo Alto Networks, Microsoft y Oracle, entre otros. En uno de los casos más llamativos, el modelo ayudó a un banco participante a frenar una transferencia fraudulenta de US$ 1,5 millones.
El programa sigue un proceso de divulgación coordinada de 90 días, con un tiempo promedio de parcheo de alrededor de dos semanas para las fallas más graves. Hasta el momento del informe se habían reportado 530 vulnerabilidades, con 75 ya corregidas y 65 advisories públicos publicados.
El progreso en seguridad de software solía estar limitado por qué tan rápido podíamos encontrar nuevas vulnerabilidades. Ahora está limitado por qué tan rápido podemos verificar, divulgar y parchear. — Anthropic
La otra cara: la carrera armamentista del bug hunting
El balance de Glasswing llega en un momento en que la misma capacidad se usa también del lado ofensivo. Esta semana se conoció TrapDoor, una campaña de cadena de suministro que no solo roba credenciales sino que apunta directamente a los asistentes de IA de los desarrolladores. La IA acelera por igual a quien encuentra fallas para corregirlas y a quien las busca para explotarlas: el cuello de botella ya no es encontrar, sino verificar, divulgar y parchear a tiempo.
Cuando la defensa también corre a velocidad de IA
Si una sola iniciativa encontró 10.000 fallas críticas en un mes, la pregunta deja de ser si la IA sirve para auditar seguridad y pasa a ser cómo absorber semejante volumen de hallazgos sin colapsar los equipos de respuesta. ¿Tu organización ya incorpora IA para revisar su propio código, o todavía la mira solo como una amenaza? Te leemos en los comentarios.
Fuentes
- Anthropic — Project Glasswing: an initial update (22 de mayo de 2026).
- The Hacker News — Claude Mythos AI finds 10,000+ high/critical vulnerabilities.
- VulnCheck — CVEs atribuidas a Project Glasswing y The Register — análisis crítico del conteo (CVE-2026-5194 en wolfSSL, CVE-2026-4747 en FreeBSD).


