# ¿Árbitros de predicción de IA? *Author: Bankless* *Published: Jan 31, 2026* *Source: https://www.bankless.com/es/ai-prediction-arbiters* --- [](https://www.bankless.com/sponsor/consensus-2026-1768833351?ref=read/babylon-predictive-intelligence-eliza&email=true) ¿Árbitros de predicción de IA? Publicado el 31 de enero de 2026 [ Ver en el navegador ](https://www.bankless.com/mindshare) --- [**Patrocinador: Bitget**](https://bankless.cc/BitGet) — ¡Nuevo ATH para el oro! Opere con oro, plata y más directamente en Bitget.[](https://bankless.ghost.io/ghost/#/editor/post/69580059dbc84d000120d568)[](https://www.bankless.com/portal/content/posts/view?id=8502)[](https://bankless.ghost.io/ghost/#/editor/post/69580059dbc84d000120d568)[](https://www.bankless.com/portal/content/posts/view?id=8502) [Comience a operar en Bitget](https://bankless.cc/BitGet) . . . RINCÓN DEL AGENTE ERC-8004 ya está disponible [](https://www.8004scan.io/)Por fin, el ERC-8004 [se lanzó el jueves](https://x.com/DavideCrapis/status/2016893815857066212), aportando una infraestructura de identidad y reputación en cadena a la economía de los agentes. El estándar resuelve dos problemas fundamentales: sin una identidad verificable, los malos actores crean agentes, extraen valor y desaparecen; sin una reputación transferible, los buenos agentes empiezan de cero cada vez que entran en un nuevo mercado. ERC-8004 busca abordar estos retos a través de tres registros en cadena: - **El Registro de Identidad** proporciona a cada agente una identidad única en cadena como token ERC-721. La identidad incluye un archivo de registro que declara las capacidades, los puntos finales de comunicación y los modelos de confianza compatibles. - **El Registro de Reputación** realiza un seguimiento de los comentarios de los clientes verificados criptográficamente. Antes de dejar una reseña, los clientes deben obtener una autorización firmada por el agente para evitar el spam. Las puntuaciones se almacenan en cadena y pueden ser consultadas por otros contratos inteligentes, es decir, un contrato de servicio podría comprobar que la puntuación de un agente supera un umbral antes de aceptar una oferta (8004scan ha hecho un gran trabajo indexando estas puntuaciones y haciéndolas localizables). - **El Registro de validación** coordina la verificación por parte de terceros del trabajo de los agentes. Nota: las especificaciones de este registro aún se están debatiendo y no estarán disponibles en el momento del lanzamiento. Conéctelos a x402 para pagos y protocolos como A2A y MCP para la comunicación, y tendrá una pila completa para la actividad económica entre agentes. [**El equipo dAI de la Fundación Ethereum**](https://x.com/VittoStack/status/2013254692411760843?s=20) ha publicado recientemente un mapa del ecosistema para los equipos que desarrollan con 8004, pero si tuviera que destacar uno en concreto que merezca la pena seguir, sería [**Daydreams**](https://x.com/daydreamsagents), que ha lanzado el SDK Lucid Agents Commerce para crear agentes compatibles con 8004. También han estado creando algunos agentes x402 bastante destacados, útiles para actividades cotidianas reales, como [descubrir libros](https://x.com/davewardonline/status/2017351796344135752?s=20), [realizar un seguimiento de los datos del Tesoro de EE. UU.](https://x.com/langoustine69A/status/2017299126896005505?s=20) o [las estadísticas de tenis](https://x.com/langoustine69A/status/2017238840482631963?s=20). Aún no hay muchos agentes activos, pero no pierdas de vista [**el directorio de búsqueda de 8004scan**](https://www.8004scan.io/), ya que ofrece una gran oportunidad para descubrir agentes a medida que se van incorporando más. . . . RESUMEN La capa que falta en los mercados de predicción resueltos por IA Autor de Bankless: [ ](https://x.com/davewardonline) [ David Christopher](https://x.com/davewardonline) [](https://www.bankless.com/read/missing-layer-ai-prediction-markets)La semana pasada, [a16z publicó una propuesta](https://x.com/a16zcrypto/status/2014393157514051663?s=20) para utilizar los LLM como jueces de los mercados de predicción. La idea es bloquear un modelo específico *y* una indicación en la cadena de bloques al crear el contrato de un mercado, permitir que los operadores examinen los matices de la resolución antes de apostar y, a continuación, ejecutarla en el momento de la resolución. El objetivo es eliminar los sesgos humanos y los problemas que pueden surgir de la resolución de disputas basada en tokens. Solo hay un problema que la propuesta pasa por alto: los LLM no están diseñados para dar la misma respuesta dos veces. [](https://x.com/a16zcrypto/status/2014393157514051663?s=20) ### **El cuello de botella de la resolución** La resolución se ha convertido en el cuello de botella de los mercados de predicción a gran escala. En su artículo, a16z cita varios mercados en los que la resolución se convirtió en un escándalo: - **El mercado electoral de Venezuela**, que alcanzó un volumen de más de 6 millones de dólares, antes de degenerar en acusaciones de resolución sesgada cuando los observadores alegaron fraude y el Gobierno declaró el resultado contrario. - **El mercado de la traje de Zelensky**, que atrajo 200 millones de dólares en apuestas sobre si el presidente de Ucrania llevaría traje a la cumbre de la OTAN. Durante la resolución del mercado, los titulares de tokens UMA cambiaron la resolución de «Sí» a «No», a pesar de que las noticias describían su atuendo como un traje, lo que provocó que los operadores protestaran y se produjera un acalorado debate sobre lo que se considera un «traje». - **Un contrato de control territorial de Ucrania** especificaba la resolución basándose en un mapa online concreto; al parecer, alguien editó el mapa para influir en el resultado. Los comités humanos tienen conflictos de intereses. Los sistemas de votación basados en tokens como UMA tienen problemas con las ballenas y cuestiones de credibilidad cuando los grandes titulares votan sobre contratos en los que han apostado; incluso si votan de forma justa, la percepción socava la confianza. Por lo tanto, como haría cualquier buen inversor de capital riesgo, a16z propone incorporar la IA. Como se ha mencionado, su idea es que, al crear el contrato, se bloquee en la cadena de bloques un LLM y un prompt específicos. Los operadores podrían inspeccionar todo el mecanismo de resolución antes de apostar: el modelo, el prompt y las fuentes de información. Si no les gusta la configuración, no operan. En la resolución, el modelo comprometido se ejecuta con el prompt comprometido y produce un juicio. No hay cambios de reglas a mitad de camino, ni decisiones discrecionales. Las ventajas son reales. Los LLM resisten mejor la manipulación que los comités humanos: no se puede sobornar fácilmente a un modelo ni editar sus pesos después del compromiso. Son transparentes de una manera que la gobernanza no puede igualar. Y no tienen ningún interés financiero en los resultados, lo que elimina el problema de conflicto de intereses que plaga la votación con tokens. Para que quede claro, a16z no propone eliminar por completo a los humanos: reconocen la necesidad de una gobernanza continua en torno a qué modelos confiar, cómo manejar los errores obvios y cuándo actualizar los valores predeterminados. Pero aquí es donde la propuesta se encuentra con un problema. ### **La brecha de reproducibilidad** Si ejecutas la misma orden en cualquier modelo importante con una configuración idéntica, obtendrás resultados diferentes. Así es como funciona la inferencia moderna. ¿Por qué? Todo se reduce a cómo procesan la información las GPU. Cuando se ejecuta un modelo, se realizan miles de cálculos simultáneamente. El orden en que se completan esos cálculos puede variar ligeramente cada vez, y esas pequeñas variaciones se acumulan en resultados finales diferentes. Todos hemos sido testigos de esto y, en el caso de los chatbots, es irrelevante. No importa si el resumen de su artículo es ligeramente diferente cada vez. En todo caso, aporta amplitud. Pero para determinar quién cobra en un mercado de 200 millones de dólares, obviamente es otra historia. En teoría, la parte perdedora podría volver a ejecutar exactamente la misma orden y obtener la respuesta opuesta. ¿Y ahora qué? La propuesta de a16z asume que bloquear un modelo y una instrucción produce una resolución verificable y auditable. Pero si alguien impugna el resultado y vuelve a ejecutar el mismo modelo con las mismas entradas, podría obtener un resultado diferente y, si los mercados mencionados anteriormente nos enseñan algo, es que los pequeños matices pueden tener un impacto significativo. Como resultado, la ventaja de la «transparencia» que aporta la IA se evapora, ya que no hay una respuesta canónica con la que realizar la auditoría. ### **Inferencia determinista de EigenAI** Esta semana, [EigenAI publicó un informe técnico](https://x.com/eigencloud/status/2014834120476786890?s=20) en el que se afirma la reproducibilidad exacta de bits en las GPU de producción: una tasa de coincidencia del 100 % en 10 000 pruebas, con una ralentización mínima de la velocidad de inferencia. La forma en que lo consiguen se reduce al control de cada capa de la pila, bloqueando todos los puntos en los que se produce variabilidad. En la capa de hardware, cualquiera que ejecute o verifique la inferencia debe utilizar modelos de GPU idénticos. Dado que las diferentes arquitecturas de chips producen resultados diferentes para los mismos cálculos, incluso cuando se ejecuta el mismo código, la estandarización del hardware se convierte en el primer requisito. En la capa de software, Eigen sustituye las bibliotecas matemáticas predeterminadas que utilizan las GPU para ejecutar cálculos por versiones personalizadas que imponen un orden estricto. Las bibliotecas *predeterminadas* dan prioridad a la velocidad sobre la coherencia; las versiones de EigenAI sacrifican una pequeña cantidad de rendimiento para garantizar resultados idénticos en todo momento. [](https://x.com/eigencloud/status/2014834120476786890?s=20)El resultado: dadas entradas idénticas, el resultado es una función pura. Ejecútelo mil veces y obtendrá resultados idénticos. Para que esto sea útil para los mercados de predicción o cualquier resultado de IA controvertido, EigenAI combina la inferencia determinista con un sistema de verificación. Su modelo toma prestado de los rollups de blockchain. La parte que ejecuta la inferencia publica los resultados cifrados. Los resultados se aceptan por defecto, pero pueden ser impugnados durante un periodo de disputa. Si se impugnan, verificadores independientes los vuelven a ejecutar dentro de enclaves de hardware seguros. Dado que la ejecución es determinista, la verificación se simplifica: ¿coinciden los resultados? Si no coinciden, la discrepancia provocará recortes, es decir, sanciones económicas deducidas de la participación garantizada. La parte original pierde dinero; el impugnador y los verificadores reciben un pago. La privacidad permanece intacta en todo momento: las solicitudes permanecen cifradas y el descifrado solo se produce dentro de entornos seguros verificados durante las disputas. [](https://x.com/eigencloud/status/2014822481744507381?s=20) ### **En qué otros ámbitos es importante** Los mercados de predicción son el caso de uso más claro, pero no son el único. ERC-8004 se lanzó el jueves, poniendo en línea sus dos primeros registros, Identidad y Reputación. El tercero, el Registro de Validación, que coordinará la verificación por terceros del trabajo de los agentes, aún está en desarrollo, pero estará disponible en breve. El Registro de Validación está diseñado para ser flexible. Admite múltiples métodos de verificación: pruebas ZK, certificación TEE, jueces humanos o reejecución asegurada por participación, en la que los validadores reproducen un cálculo y comparan los resultados. El registro en sí mismo es solo una capa de coordinación: registra que un validador ha comprobado algo y cuál ha sido su conclusión, sin exigir cómo ha llegado a ella. [ERC-8004: La pieza que le faltaba a la economía de las máquinas enBanklessERC-8004 se lanza el 16 de enero, aportando identidad y reputación en cadena a los agentes autónomos. La capa de confianza de la economía de las máquinas ya está aquí.BanklessDavid Christopher 9 de enero de 2026 • 5 min de lectura](https://www.bankless.com/read/erc-8004-the-machine-economys-missing-piece)Para la mayoría de estos métodos, la reproducibilidad es irrelevante. Las pruebas ZK verifican que un cálculo se ha realizado correctamente sin volver a ejecutarlo. La certificación TEE demuestra que un código específico se ha ejecutado en un entorno seguro. Ninguno de los dos requiere que la inferencia subyacente sea determinista. Dicho esto, para operaciones de alto riesgo, como un agente que gestiona un capital significativo, por ejemplo, la validación basada en la reejecución podría añadir una capa adicional de seguridad. En esos casos, los creadores se encontrarían con el mismo obstáculo que los mercados de predicción: sin una inferencia determinista, no se puede distinguir entre un agente que «ha hecho trampa» y otro que simplemente ha obtenido un resultado diferente de una ejecución no determinista. Soluciones como la de EigenAI encajarían aquí, permitiendo la validación basada en la reejecución como una opción entre muchas otras. No es un requisito para que ERC-8004 funcione, pero para ciertos casos de uso, podría ser importante. ### **El patrón emergente** En general, la idea de a16z sobre los jueces LLM es sólida: transparente, neutral y resistente a la manipulación. Pero sin reproducibilidad, la propuesta carece de la capa de verificación que la haría fiable a gran escala. El libro blanco de EigenAI sugiere que esta laguna se puede resolver. La inferencia determinista se puede lograr con las restricciones adecuadas: hardware estandarizado, bibliotecas personalizadas, entornos de ejecución controlados. Las compensaciones son manejables: un pequeño impacto en el rendimiento a cambio de la capacidad de auditar realmente lo que hizo una IA. En el caso concreto de los mercados de predicción, esto podría resolver uno de sus problemas fundamentales. No solo se fija el modelo y la indicación, sino también la infraestructura que garantiza que cualquiera puede volver a ejecutar la resolución y obtener la misma respuesta. Sin embargo, antes de hacerlo, es mejor pensárselo dos veces antes de dejar la resolución en manos de las máquinas. [Marcar en Bankless](https://www.bankless.com/read/missing-layer-ai-prediction-markets) --- ## ***Además, otras noticias de esta semana*...** ### 🤖 **IA Criptográfica ** - **🔥 Bankr**: [ha anunciado un repositorio de habilidades en el que los agentes guardan los conocimientos adquiridos para que estén disponibles para todos los demás agentes. Las habilidades publicadas incluyen Polymarket, análisis técnico, lanzamiento de tokens, etc.](https://x.com/0xDeployer/status/2016408217233064051?s=20) - **Synthdata**: [lanzó la API Synth y planes de suscripción para su subred de inteligencia predictiva.](https://x.com/SynthdataCo/status/2016186907986677965?s=20) - **Venice**: [ha lanzado la inferencia privada para su uso en Moltbot (Clawdbot)](https://x.com/ErikVoorhees/status/2015501728008081672?s=20). - **USDai** — [Anuncia la ICO y la TGE para el token gubernamental CHIP, que llegará en el primer trimestre ](https://x.com/USDai_Official/status/2016179515769167970?s=20)[tras conceder préstamos por valor de cientos de millones en las últimas semanas.](https://x.com/sharon__ai/status/2014373803644879246?s=20) ### **📣 Noticias generales** - **Anthropic**: [ha lanzado aplicaciones interactivas dentro de Claude, lo que permite a los usuarios ejecutar aplicaciones populares como Asana, Figma, Canva, etc. sin salir del chat](https://claude.com/blog/interactive-tools-in-claude), [al tiempo que, según se informa, ha duplicado su recaudación de fondos hasta alcanzar los 20 000 millones de dólares.](https://x.com/DegenerateNews/status/2016222648590639348?s=20) - **China** — [*Alibaba* ha abierto el código fuente de Z-Image, la base completa de su modelo de imágenes mejor clasificado](https://github.com/Tongyi-MAI/Z-Image), y [ha lanzado Qwen3-Max-Thinking, un nuevo modelo de razonamiento competitivo con todos los modelos líderes](https://qwen.ai/blog?id=qwen3-max-thinking). [*DeepSeek* ha abierto el código fuente de OCR 2, un modelo de extracción de texto de documentos que encabeza las pruebas de rendimiento con una eficiencia de tokens mejorada](https://github.com/deepseek-ai/DeepSeek-OCR-2). - **Moonshot** (*también «China», pero destacada*): [ha abierto el código fuente de Kimi K2.5, su nuevo modelo que rivaliza con GPT-5.2 y Claude Opus 4.5 en pruebas de codificación, visión y agencia, y cuenta con Agent Swarm para gestionar hasta 100 subagentes, además de lanzar Kimi Code, un agente de codificación basado en terminal.](https://x.com/Kimi_Moonshot/status/2016024049869324599?s=20) - **OpenAI**: [según se informa, está creando una red social y considerando la verificación biométrica, como World's orb o Face ID de Apple, para garantizar que los usuarios sean humanos.](https://www.forbes.com/sites/annatong/2026/01/28/openai-wants-to-create-biometric-social-network-to-kill-xs-bot-problem/) - **🔥 OpenClaw**: [el agente de IA de código abierto anteriormente conocido como Clawdbot cambió de nombre dos veces después de que Anthropic señalara problemas con la marca registrada, y ahora cuenta con más de 100 000 estrellas en GitHub.](https://x.com/openclaw/status/2016058924403753024) [Mientras tanto, Moltbook se lanzó como una plataforma social similar a Reddit para agentes de IA: miles de bots de OpenClaw ahora publican, debaten, forman comunidades y discuten sobre la superación personal.](https://x.com/eeelistar/status/2017239546950521081?s=20) ### **📚 Lecturas** - **Auditless**: [minimalismo en IA](https://research.auditless.com/p/ai-minimalism) - **Castle Labs** — [USDai: ¿combustible para la era digital?](https://open.substack.com/pub/castlelabs/p/usdai-fuel-for-the-digital-age) - **🔥 Dario Amodei** — [La adolescencia de la tecnología: afrontar y superar los riesgos de una IA poderosa](https://www.darioamodei.com/essay/the-adolescence-of-technology) ---

El oro y la plata están alcanzando nuevos máximos. Aprovecha el impulso en Bitget: opera en 79 mercados macro (materias primas, divisas e índices) directamente con USDT. Diversifica en una sola aplicación con gran liquidez, bajo deslizamiento y un apalancamiento de hasta 500x para adaptarse a diferentes estilos de riesgo.