# Claude descifra los contratos inteligentes

*Author: David Christopher*
*Published: Dec 5, 2025*
*Source: https://www.bankless.com/es/read/claude-report-smart-contracts-exploits*

---

El lunes, Anthropic publicó un [informe de su programa Fellows](https://red.anthropic.com/2025/smart-contracts/) aplicando LLMs populares a la tarea de explotar contratos inteligentes. Todos deberíamos prestar atención.

El gran titular: los principales modelos - Opus 4.5, Sonnet 4.5, y GPT-5 - fueron capaces de crackear más del 55% de los exploits realizados este año después de su corte de formación de conocimientos. Sin ningún conocimiento previo de cómo se produjeron estos hackeos, estos modelos identificaron vulnerabilidades y desarrollaron exploits que, en simulación, habrían robado 4,6 millones de dólares.*(Anthropic dejó claro que realizaron todas las pruebas en un entorno controlado, sin tocar nunca blockchains en vivo*).

[Desembalaje de las consecuencias de la vulnerabilidad de Balancer V2 en BanklessEl DEX de primera clase y sus bifurcaciones fueron víctimas de un importante exploit el lunes por la mañana.![](https://bankless.ghost.io/content/images/icon/apple-touch-icon-614.png)BanklessJackInabinet Nov 3, 2025 - 3 min read![](https://bankless.ghost.io/content/images/thumbnail/unpacking-the-balancer-v2-exploit-fallout-1762208937.png)](https://www.bankless.com/read/unpacking-the-balancer-v2-exploit-fallout)Retrocedamos y detallemos el camino que les ha llevado hasta aquí.

Recientemente, Anthropic ha realizado un esfuerzo concertado para identificar e investigar los ciberataques basados en IA. Publicaron un informe sobre lo que creen que es la primera operación de ciberespionaje llevada a cabo con IA, en el que describen cómo un grupo vinculado al estado chino [encarceló a Claude](https://www-cdn.anthropic.com/b2a76c6f6992465c09a6f2fce282f6c0cea8c200.pdf) para llevar a cabo la mayor parte de una operación de espionaje a gran escala, con una intervención humana mínima. Y, a principios de este año, publicaron un informe con Carnegie Mellon que mostraba cómo la [la IA puede simplificar el proceso](https://red.anthropic.com/2025/ai-for-cyber-defenders/) de llevar a cabo ciberataques, con el mensaje de que estas herramientas están bien equipadas y son muy capaces de realizar con éxito tareas "maliciosas".

Continuando con esta investigación, se centraron en los exploits de contratos inteligentes, ejecutando modelos populares contra dos grupos de contratos explotados utilizando [SCONE-bench](https://github.com/safety-research/SCONE-bench?tab=readme-ov-file) (Smart CONtract Exploitation benchmark), un punto de referencia construido por los Fellows para evaluar y simular exploits:

- 405 contratos explotados entre 2020 y marzo de 2025 (fecha límite elegida por ser el último evento de formación de conocimientos para estos modelos)
- 34 contratos explotados después del 1 de marzo de 2025 (lo que significa que los LLM no fueron entrenados en documentos post-mortem que podrían ayudarles a entender lo que sucedió)
Compuesto por exploits del repositorio [repositorio DeFiHackLabs](https://github.com/SunWeb3Sec/DeFiHackLabs/tree/main)SCONE-bench sirvió tanto de conjunto de pruebas como de entorno de pruebas. Cada modelo se probó en una réplica de la cadena bifurcada localmente en el bloque exacto del exploit original, y luego se ejecutó para ver si podía descifrar el contrato de nuevo.

De los 405 contratos, los 10 modelos probados explotaron 207 (alrededor del 51%), lo que supuso un botín simulado de 550,1 millones de dólares. Pero recordemos que se trata de contratos explotados antes de marzo de 2025, lo que significa que los modelos probablemente tuvieron acceso a las autopsias en sus datos de entrenamiento, por lo que es de esperar que tuvieran éxito en una buena parte.

Pero lo que es impresionante -o preocupante, dependiendo de quién seas- es el rendimiento posterior a marzo de 2025. Opus 4.5, Sonnet 4.5 y GPT-5 descifraron 19 de los 34 contratos (55,8%) explotados después de marzo de 2025, lo que significa que no tenían acceso a las autopsias y que lo estaban resolviendo desde cero. Sólo Opus 4.5 fue responsable de 17 de ellos.

[![](https://bankless.ghost.io/content/images/2025/12/data-src-image-ad5cc48d-318f-48a9-a22c-a3b57967da82.png)](https://red.anthropic.com/2025/smart-contracts/)Para poner la trayectoria en perspectiva: **hace un año, los agentes de IA sólo podían explotar alrededor del 2% de las vulnerabilidades en esta misma porción posterior al corte del punto de referencia. Ahora alcanzan el 55,8%.** El informe estima que los ingresos por exploits se han duplicado aproximadamente cada 1,3 meses.

### **Hackear hacia delante**
Anthropic no se limitó al análisis retrospectivo. Para comprobar si estos modelos podían encontrar vulnerabilidades realmente novedosas, y no sólo recrear ataques conocidos, dirigieron tanto Sonnet 4.5 como GPT-5 a 2.849 contratos recientemente implementados sin vulnerabilidades conocidas. Ambos agentes descubrieron dos nuevos exploits de día cero por valor de 3.694 dólares en ingresos simulados. ¿El coste total de la API de GPT-5 para escanear los 2.849 contratos? Sólo 3.476 dólares, lo que significa que, a una media de 1,22 dólares por contrato escaneado, la explotación autónoma es ahora básicamente rentable. Según el informe, esto demuestra "como prueba de concepto que la explotación autónoma rentable en el mundo real es técnicamente factible".

Anthropic se da cuenta de que la ofensiva se está automatizando, y se está volviendo más precisa, mientras que la capacidad defensiva no crece al mismo ritmo. ¿Por qué? Por un desequilibrio en los incentivos económicos, ya que la posibilidad de explotar el sistema supone una tentadora recompensa para los atacantes dispuestos a desplegar estas herramientas.

Las mismas capacidades que hacen que los agentes sean eficaces en la explotación de contratos inteligentes -razonamiento a largo plazo, análisis de límites, uso iterativo de herramientas- se extienden a todo tipo de software. A medida que se reduzcan los costes de la IA y aumenten sus capacidades, el intervalo entre el despliegue de un contrato vulnerable y su explotación seguirá reduciéndose, dejando a los desarrolladores menos tiempo para detectar y parchear. Las bases de código abierto, como los contratos inteligentes, pueden ser las primeras en enfrentarse a esta oleada de escrutinio automatizado, pero es poco probable que el software propietario permanezca sin estudiar durante mucho tiempo.

[![](https://bankless.ghost.io/content/images/2025/12/data-src-image-ed9aec50-9cae-4e96-a2f1-bb869c9c892a.png)](https://red.anthropic.com/2025/smart-contracts/)
### **Reflexiones finales**
Sin embargo, hay un resquicio de esperanza. Los mismos agentes capaces de explotar vulnerabilidades también pueden desplegarse para parchearlas. Nethermind, la tienda de contratos inteligentes y desarrolladores de seguridad, ha estado explorando esto con AuditAgent, una herramienta de auditoría de IA que han integrado en su flujo de trabajo como "auditor en pareja" junto a revisores humanos. [Desde septiembre](https://auditagent.nethermind.io/blog/how-nethermind-security-uses-auditagent-alongside-manual-audits-copy)en 29 auditorías, AuditAgent detectó problemas válidos en el 62% de los proyectos y marcó el 30% de todos los hallazgos identificados por los auditores, con tasas de detección particularmente altas para vulnerabilidades de gravedad crítica (42%) y alta (43%). Seguramente hay otros que están haciendo un trabajo similar que me estoy perdiendo. Pero, como afirma Anthropic, la defensa no conlleva los mismos "ingresos" directos -como ellos los llaman- que la explotación. Los atacantes que tienen éxito se van con los fondos robados; los defensores que tienen éxito simplemente evitan una pérdida. Hasta que se cierre esa brecha de incentivos, el ataque seguirá creciendo más rápido que la defensa.

La esperanza de Anthropic, y la mía también, es que este informe y otros similares ayuden a actualizar los modelos mentales de los defensores para que se ajusten a la realidad, con un esfuerzo más concertado para diseñar sistemas que vayan más allá de las recompensas y la supervisión para defender los contratos. No estoy seguro de cómo sería exactamente, pero puedo prometer que implica IA onchain.