# KI-Vorhersage-Schiedsrichter?

*Author: Bankless*
*Published: Jan 31, 2026*
*Source: https://www.bankless.com/de/ai-prediction-arbiters*

---

[![](https://bankless.ghost.io/content/images/2026/01/Group_690.webp)](https://www.bankless.com/sponsor/consensus-2026-1768833351?ref=read/babylon-predictive-intelligence-eliza&email=true)

  

KI-Vorhersage-Schiedsrichter?
  

  
  Veröffentlicht am 31. Januar 2026 

[
  
  Im Browser anzeigen

](https://www.bankless.com/mindshare)
 

---
[**Sponsor: Bitget**](https://bankless.cc/BitGet) – Neuer ATH für Gold! Handeln Sie Gold, Silber und mehr direkt auf Bitget.[](https://bankless.ghost.io/ghost/#/editor/post/69580059dbc84d000120d568)[](https://www.bankless.com/portal/content/posts/view?id=8502)[](https://bankless.ghost.io/ghost/#/editor/post/69580059dbc84d000120d568)[](https://www.bankless.com/portal/content/posts/view?id=8502)

[Beginnen Sie mit dem Handel auf Bitget](https://bankless.cc/BitGet)

.  .  .

 
  
    
      
      AGENTENECKE
    
    
 
  
    
ERC-8004 geht live
  

  

 

[![](https://bankless.ghost.io/content/images/2026/01/image---2026-01-30T132244.598.png)](https://www.8004scan.io/)Endlich ist es soweit: ERC-8004 [am Donnerstag](https://x.com/DavideCrapis/status/2016893815857066212)und bringt damit eine On-Chain-Identitäts- und Reputationsinfrastruktur in die Agenturwirtschaft. 

Der Standard löst zwei Kernprobleme: Ohne überprüfbare Identität können schlechte Akteure Agenten aufbauen, Werte extrahieren und dann verschwinden; ohne übertragbare Reputation müssen gute Agenten jedes Mal, wenn sie einen neuen Markt betreten, bei Null anfangen.

ERC-8004 versucht, diese Herausforderungen durch drei On-Chain-Register zu lösen:

- **Das Identitätsregister** gibt jedem Agenten eine eindeutige On-Chain-Identität als ERC-721-Token. Die Identität umfasst eine Registrierungsdatei, in der Fähigkeiten, Kommunikationsendpunkte und unterstützte Vertrauensmodelle angegeben sind.
- **Das Reputationsregister** verfolgt kryptografisch verifizierte Rückmeldungen von Kunden. Bevor sie eine Bewertung abgeben können, müssen Kunden eine unterschriebene Genehmigung des Agenten einholen, um Spam zu verhindern. Die Bewertungen werden in der Blockchain gespeichert und können von anderen Smart Contracts abgefragt werden – d. h. ein Dienstleistungsvertrag könnte überprüfen, ob die Bewertung eines Agenten einen Schwellenwert überschreitet, bevor ein Angebot angenommen wird (8004scan hat diese Bewertungen hervorragend indexiert und auffindbar gemacht).
- **Das Validierungsregister** koordiniert die Überprüfung der Arbeit von Agenten durch Dritte. Hinweis: Die Spezifikation dieses Registers wird noch aktiv diskutiert und ist zum Zeitpunkt der Einführung noch nicht live.
Verbinden Sie diese mit x402 für Zahlungen und Protokollen wie A2A und MCP für die Kommunikation, und Sie haben einen kompletten Stack für die wirtschaftliche Aktivität zwischen Agenten.

[**Das dAI-Team der Ethereum Foundation**](https://x.com/VittoStack/status/2013254692411760843?s=20) hat kürzlich eine Ökosystemkarte für Teams veröffentlicht, die mit 8004 arbeiten. Wenn ich jedoch ein Team hervorheben soll, das es wert ist, verfolgt zu werden, würde ich [**Daydreams**](https://x.com/daydreamsagents) nennen, das das Lucid Agents Commerce SDK für die Entwicklung von 8004-fähigen Agenten veröffentlicht hat. Das Unternehmen hat auch einige ziemlich herausragende x402-Agenten entwickelt, die für alltägliche Aktivitäten wie [das Entdecken von Büchern](https://x.com/davewardonline/status/2017351796344135752?s=20), [das Verfolgen von US-Finanzdaten](https://x.com/langoustine69A/status/2017299126896005505?s=20) oder [Tennisstatistiken](https://x.com/langoustine69A/status/2017238840482631963?s=20) nützlich sind.

Es gibt noch nicht viele Agenten, aber behalten Sie [**das durchsuchbare Verzeichnis von 8004scan**](https://www.8004scan.io/) im Auge, da es eine großartige Möglichkeit bietet, Agenten zu entdecken, sobald mehr von ihnen online gehen.

.  .  .

 
  
    

   ZUSAMMENFASSUNG

 
  
    
Die fehlende Ebene in KI-gestützten Prognosemärkten
    
  
   
     
     Bankless Autor: 
     
       
 [     ](https://x.com/davewardonline) 
 [     David Christopher](https://x.com/davewardonline)
     
    
 

[![](https://bankless.ghost.io/content/images/2026/01/image---2026-01-30T130535.550-1.png)](https://www.bankless.com/read/missing-layer-ai-prediction-markets)Letzte Woche [veröffentlichte a16z einen Vorschlag](https://x.com/a16zcrypto/status/2014393157514051663?s=20) für die Verwendung von LLMs als Richter in Prognosemärkten. 

Der Vorschlag sieht vor, ein bestimmtes Modell *und* eine bestimmte Eingabe bei der Erstellung eines Marktvertrags in der Blockchain zu speichern, den Händlern vor dem Wetten die Möglichkeit zu geben, die Nuancen der Lösung zu prüfen, und diese dann bei der Lösung auszuführen. Das Ziel dabei ist es, menschliche Voreingenommenheit und Probleme zu beseitigen, die bei der tokenbasierten Streitbeilegung auftreten können.

Es gibt nur ein Problem, das der Vorschlag übersieht: LLMs sind nicht dafür ausgelegt, zweimal dieselbe Antwort zu geben.

[![](https://bankless.ghost.io/content/images/2026/01/data-src-image-a143d769-0d4c-4f7f-873e-0528c144cba7.png)](https://x.com/a16zcrypto/status/2014393157514051663?s=20)
### **Der Engpass bei der Lösung**
Die Lösung ist zum Engpass für Prognosemärkte in großem Maßstab geworden.

In ihrem Artikel nennt a16z mehrere Märkte, auf denen die Lösung zu einem Skandal führte:

- Der **Wahlmarkt in Venezuela**, der ein Volumen von über 6 Millionen Dollar verzeichnete, bevor er in Vorwürfe einer voreingenommenen Lösung mündete, als Beobachter Betrug behaupteten und die Regierung das gegenteilige Ergebnis verkündete. 
- Der **Zelensky-Anzug-Markt**, auf dem 200 Millionen Dollar darauf gewettet wurden, ob der ukrainische Präsident bei einem NATO-Gipfel einen Anzug tragen würde. Während der Auflösung des Marktes änderten die UMA-Token-Inhaber die Auflösung von „Ja” zu „Nein”, obwohl in den Nachrichten berichtet wurde, dass er einen Anzug tragen würde, was zu Protesten der Händler und hitzigen Diskussionen darüber führte, was als „Anzug” gilt. 
- **Ein Vertrag über die territoriale Kontrolle der Ukraine** sah eine Entscheidung auf der Grundlage einer bestimmten Online-Karte vor; angeblich hat jemand die Karte bearbeitet, um das Ergebnis zu beeinflussen.
Menschliche Komitees haben Interessenkonflikte. Token-basierte Abstimmungssysteme wie UMA haben Probleme mit „Walen” und Glaubwürdigkeitsprobleme, wenn große Inhaber über Verträge abstimmen, auf die sie gewettet haben – selbst wenn sie fair abstimmen, untergräbt die Optik das Vertrauen.

Daher schlägt a16z, wie es jeder gute VC tun würde, den Einsatz von KI vor. Wie bereits erwähnt, besteht ihre Idee darin, dass bei der Vertragserstellung ein bestimmtes LLM und ein bestimmter Prompt in der Blockchain festgeschrieben werden. Händler könnten vor dem Wetten den gesamten Lösungsmechanismus überprüfen – das Modell, den Prompt, die Informationsquellen. Wenn ihnen die Konfiguration nicht gefällt, handeln sie nicht. Bei der Lösung wird das festgelegte Modell mit dem festgelegten Prompt ausgeführt und liefert ein Urteil. Keine Regeländerungen während des Handels, keine Ermessensentscheidungen.

Die Vorteile sind real. LLMs widerstehen Manipulationen besser als menschliche Gremien – man kann ein Modell nicht einfach bestechen oder seine Gewichte nach der Festlegung ändern. Sie sind in einer Weise transparent, die Governance nicht erreichen kann. Und sie haben kein finanzielles Interesse an den Ergebnissen, wodurch das Problem der Interessenkonflikte, das die Token-Abstimmung plagt, beseitigt wird. Um es klar zu sagen: a16z schlägt nicht vor, Menschen vollständig zu entfernen – sie erkennen die Notwendigkeit einer kontinuierlichen Governance an, bei der es darum geht, welchen Modellen man vertrauen kann, wie man mit offensichtlichen Fehlern umgeht und wann man Standardeinstellungen aktualisieren sollte.

Aber genau hier stößt der Vorschlag auf Schwierigkeiten.

### **Die Reproduzierbarkeitslücke**
Wenn Sie denselben Befehl mit identischen Einstellungen in einem beliebigen gängigen Modell ausführen, erhalten Sie unterschiedliche Ergebnisse. So funktioniert moderne Inferenz.

Warum? Das hängt damit zusammen, wie GPUs Informationen verarbeiten. Wenn Sie ein Modell ausführen, finden Tausende von Berechnungen gleichzeitig statt. Die Reihenfolge, in der diese Berechnungen abgeschlossen werden, kann jedes Mal leicht variieren, und diese winzigen Abweichungen führen zu unterschiedlichen Endergebnissen. Wir alle haben dies schon erlebt, und für Chatbots ist es irrelevant. Es spielt keine Rolle, wenn Ihre Artikelzusammenfassung jedes Mal etwas anders ausfällt. Wenn überhaupt, sorgt dies für mehr Vielfalt. Aber wenn es darum geht, zu bestimmen, wer in einem 200-Millionen-Dollar-Markt bezahlt wird, sieht die Sache natürlich anders aus. Theoretisch könnte die unterlegene Partei genau dieselbe Eingabe erneut ausführen und die gegenteilige Antwort erhalten.

Was nun?

Der Vorschlag von a16z geht davon aus, dass die Festlegung eines Modells und einer Eingabe zu einer überprüfbaren, auditierbaren Lösung führt. Wenn jedoch jemand das Ergebnis anzweifelt und dasselbe Modell mit denselben Eingaben erneut ausführt, erhält er möglicherweise ein anderes Ergebnis. Und wenn uns die oben genannten Märkte etwas lehren, dann ist es, dass kleine Nuancen erhebliche Auswirkungen haben können.

Infolgedessen schwindet der Vorteil der „Transparenz” durch den Einsatz von KI, da es keine kanonische Antwort gibt, anhand derer eine Prüfung erfolgen könnte.

### **Deterministische Inferenz von EigenAI**
Diese Woche [veröffentlichte EigenAI ein Whitepaper](https://x.com/eigencloud/status/2014834120476786890?s=20) veröffentlicht, in dem eine bitgenaue Reproduzierbarkeit auf Produktions-GPUs behauptet wird: 100 % Übereinstimmungsrate bei 10.000 Testläufen mit minimaler Verlangsamung der Inferenzgeschwindigkeit.

Um dies zu erreichen, muss jede Ebene des Stacks kontrolliert werden – alle Stellen, an denen Variabilität auftreten kann, müssen gesperrt werden.

Auf der Hardware-Ebene muss jeder, der Inferenz ausführt oder überprüft, identische GPU-Modelle verwenden. Da unterschiedliche Chip-Architekturen selbst bei Ausführung desselben Codes zu unterschiedlichen Ergebnissen für dieselben Berechnungen führen, ist die Standardisierung der Hardware die erste Voraussetzung.

Auf der Softwareebene ersetzt Eigen die Standard-Mathematikbibliotheken, die GPUs für Berechnungen verwenden, durch benutzerdefinierte Versionen, die eine strenge Reihenfolge erzwingen. Die *Standardbibliotheken* priorisieren Geschwindigkeit gegenüber Konsistenz; die Versionen von EigenAI opfern einen kleinen Teil der Leistung, um jedes Mal identische Ergebnisse zu garantieren.

[![](https://bankless.ghost.io/content/images/2026/01/data-src-image-1ecc54a9-f807-4004-9103-588a66174a61.png)](https://x.com/eigencloud/status/2014834120476786890?s=20)Das Ergebnis: Bei identischen Eingaben ist die Ausgabe eine reine Funktion. Wenn man sie tausend Mal ausführt, erhält man identische Ergebnisse.

Um dies für Prognosemärkte oder umstrittene KI-Ausgaben nutzbar zu machen, kombiniert EigenAI deterministische Inferenz mit einem Verifizierungssystem. Ihr Modell lehnt sich an Blockchain-Rollups an. Die Partei, die die Inferenz durchführt, veröffentlicht verschlüsselte Ergebnisse. Die Ergebnisse werden standardmäßig akzeptiert, können aber während eines Streitfensters angefochten werden. Im Falle einer Anfechtung führen unabhängige Prüfer die Ausführung innerhalb sicherer Hardware-Enklaven erneut durch. Da die Ausführung deterministisch ist, wird die Verifizierung einfach: Stimmen die Ergebnisse überein?

Ist dies nicht der Fall, löst die Nichtübereinstimmung eine Strafe aus – wirtschaftliche Sanktionen, die aus dem gebundenen Einsatz gezogen werden. Die ursprüngliche Partei verliert Geld, der Anfechter und die Prüfer werden bezahlt. Die Privatsphäre bleibt dabei vollständig gewahrt: Die Eingabeaufforderungen bleiben verschlüsselt, die Entschlüsselung erfolgt nur innerhalb verifizierter sicherer Umgebungen während Streitfällen.

[![](https://bankless.ghost.io/content/images/2026/01/data-src-image-94a56954-81d6-4456-a488-a46032dc64b2.png)](https://x.com/eigencloud/status/2014822481744507381?s=20)
### **Wo dies noch von Bedeutung ist**
Prognosemärkte sind der offensichtlichste Anwendungsfall, aber nicht der einzige.

ERC-8004 wurde am Donnerstag eingeführt und hat seine ersten beiden Register, Identität und Reputation, online gestellt. Das dritte, das Validierungsregister, das die Überprüfung der Arbeit von Agenten durch Dritte koordinieren wird, befindet sich noch in der Entwicklung, wird aber in Kürze verfügbar sein.

Das Validierungsregister ist flexibel gestaltet. Es wird mehrere Verifizierungsmethoden unterstützen: ZK-Proofs, TEE-Beglaubigungen, menschliche Richter oder durch Stakes gesicherte Wiederholungen, bei denen Validatoren eine Berechnung reproduzieren und die Ergebnisse vergleichen. Das Register selbst ist nur eine Koordinationsschicht – es zeichnet auf, dass ein Validator etwas überprüft hat und zu welchem Ergebnis er gekommen ist, ohne vorzuschreiben, wie er zu diesem Ergebnis gekommen ist.

[ERC-8004: Das fehlende Puzzleteil der Maschinenwirtschaft aufBanklessERC-8004 startet am 16. Januar und bringt On-Chain-Identität und Reputation für autonome Agenten. Die Vertrauensschicht der Maschinenwirtschaft ist da.![](https://bankless.ghost.io/content/images/icon/apple-touch-icon-681.png)BanklessDavid Christopher 9. Januar 2026 • 5 Min. Lesezeit![](https://bankless.ghost.io/content/images/thumbnail/erc-8004-the-machine-economy-s-missing-piece-1767999856.png)](https://www.bankless.com/read/erc-8004-the-machine-economys-missing-piece)Bei den meisten dieser Methoden ist die Reproduzierbarkeit irrelevant. ZK-Proofs überprüfen, ob eine Berechnung korrekt durchgeführt wurde, ohne sie erneut auszuführen. TEE-Attestierungen beweisen, dass ein bestimmter Code in einer sicheren Umgebung ausgeführt wurde. Bei beiden ist es nicht erforderlich, dass die zugrunde liegende Schlussfolgerung deterministisch ist.

Bei Operationen mit hohem Einsatz – beispielsweise bei einem Agenten, der bedeutendes Kapital verwaltet – könnte eine auf erneuter Ausführung basierende Validierung jedoch eine zusätzliche Sicherheitsebene bieten. In diesen Fällen würden Entwickler auf dieselbe Hürde stoßen wie bei Prognosemärkten: Ohne deterministische Inferenz kann man nicht zwischen einem Agenten, der „betrogen” hat, und einem, der einfach ein anderes Ergebnis aus einer nicht deterministischen Ausführung erhalten hat, unterscheiden.

Lösungen wie die von EigenAI würden hier zum Einsatz kommen und die Validierung auf Basis der erneuten Ausführung als eine von vielen Optionen ermöglichen. Dies ist keine Voraussetzung für die Funktion von ERC-8004, könnte aber für bestimmte Anwendungsfälle von Bedeutung sein.

### **Das sich abzeichnende Muster**
Insgesamt ist die Idee von a16z, LLM-Richter einzusetzen, sinnvoll – transparent, neutral, resistent gegen Manipulationen. Aber ohne Reproduzierbarkeit fehlt dem Vorschlag die Verifizierungsebene, die ihn in großem Maßstab vertrauenswürdig machen würde.

Das Whitepaper von EigenAI legt nahe, dass diese Lücke geschlossen werden kann. Deterministische Inferenz ist mit den richtigen Einschränkungen erreichbar: standardisierte Hardware, benutzerdefinierte Bibliotheken, kontrollierte Ausführungsumgebungen. Die Kompromisse sind überschaubar – eine geringe Leistungseinbuße für die Möglichkeit, tatsächlich zu überprüfen, was eine KI getan hat.

Speziell für Prognosemärkte könnte dies eines ihrer Kernprobleme lösen. Es werden nicht nur das Modell und die Eingabe festgelegt, sondern auch die Infrastruktur, die garantiert, dass jeder die Auflösung erneut ausführen und das gleiche Ergebnis erhalten kann. Bevor wir das tun, sollten wir jedoch zweimal darüber nachdenken, ob wir die Auflösung den Maschinen überlassen wollen.

[Lesezeichen auf Bankless](https://www.bankless.com/read/missing-layer-ai-prediction-markets)
---

## ***Außerdem weitere Nachrichten dieser Woche*...**

### 
🤖 **KI-Krypto **
- **🔥 Bankr** – [Ankündigung eines Kompetenz-Repositorys, in dem Agenten ihre Erkenntnisse speichern, die dann allen anderen Agenten zur Verfügung stehen. Zu den veröffentlichten Kompetenzen gehören Polymarket, technische Analyse, Token-Einführung usw.](https://x.com/0xDeployer/status/2016408217233064051?s=20)
- **Synthdata** — [Startete die Synth-API und Abonnementpläne für sein Predictive Intelligence Subnet](https://x.com/SynthdataCo/status/2016186907986677965?s=20).
- **Venice** — [Startete private Inferenz zur Verwendung in Moltbot (Clawdbot)](https://x.com/ErikVoorhees/status/2015501728008081672?s=20).
- **USDai** — [Kündigt ICO und TGE für den Gov-Token CHIP im ersten Quartal an, ](https://x.com/USDai_Official/status/2016179515769167970?s=20)[nachdem in den letzten Wochen Kredite in Höhe von mehreren hundert Millionen vergeben wurden](https://x.com/sharon__ai/status/2014373803644879246?s=20) [. ](https://x.com/USDai_Official/status/2016179515769167970?s=20)

### **📣 Allgemeine Nachrichten**
- **Anthropic** – [Start von interaktiven Apps innerhalb von Claude, mit denen Benutzer beliebte Apps wie Asana, Figma, Canva usw. ausführen können, ohne den Chat zu verlassen](https://claude.com/blog/interactive-tools-in-claude), [während gleichzeitig die Mittelbeschaffung Berichten zufolge auf 20 Milliarden US-Dollar verdoppelt wurde](https://x.com/DegenerateNews/status/2016222648590639348?s=20)
- **China** – [*Alibaba* hat Z-Image, die vollständige Basis seines führenden Bildmodells, als Open Source veröffentlicht](https://github.com/Tongyi-MAI/Z-Image) und [Qwen3-Max-Thinking herausgebracht, ein neues Schlussfolgerungsmodell, das mit allen führenden Modellen konkurrieren kann](https://qwen.ai/blog?id=qwen3-max-thinking). [*DeepSeek* hat OCR 2 als Open Source veröffentlicht, ein Modell zur Extraktion von Dokumententexten, das mit verbesserter Token-Effizienz die Benchmarks anführt](https://github.com/deepseek-ai/DeepSeek-OCR-2)
- **Moonshot** (*ebenfalls „China”, aber herausragend*) – [Hat Kimi K2.5 als Open Source veröffentlicht, sein neues Modell, das GPT-5.2 und Claude Opus 4.5 in den Bereichen Codierung, Vision und Agenten-Benchmarks Konkurrenz macht, sowie Agent Swarm für die Verwaltung von bis zu 100 Unteragenten, und hat Kimi Code veröffentlicht, einen terminalbasierten Codierungsagenten.](https://x.com/Kimi_Moonshot/status/2016024049869324599?s=20)
- **OpenAI** – [Baut Berichten zufolge ein soziales Netzwerk auf und erwägt biometrische Verifizierung wie World's Orb oder Apples Face ID, um sicherzustellen, dass die Nutzer Menschen sind](https://www.forbes.com/sites/annatong/2026/01/28/openai-wants-to-create-biometric-social-network-to-kill-xs-bot-problem/)
- **🔥 OpenClaw** – [Der Open-Source-KI-Agent, früher bekannt als Clawdbot, wurde zweimal umbenannt, nachdem Anthropic Bedenken hinsichtlich des Markenzeichens geäußert hatte, und hat nun über 100.000 GitHub-Sterne.](https://x.com/openclaw/status/2016058924403753024) [Unterdessen wurde Moltbook als Reddit-ähnliche soziale Plattform für KI-Agenten gestartet – Tausende von OpenClaw-Bots posten, debattieren, bilden Communities und diskutieren über Selbstverbesserungen.](https://x.com/eeelistar/status/2017239546950521081?s=20)

### **📚 Lesestoff**
- **Auditless** – [KI-Minimalismus](https://research.auditless.com/p/ai-minimalism)
- **Castle Labs** – [USDai: Treibstoff für das digitale Zeitalter?](https://open.substack.com/pub/castlelabs/p/usdai-fuel-for-the-digital-age)
- **🔥 Dario Amodei** – [Die Adoleszenz der Technologie: Konfrontation und Überwindung der Risiken leistungsstarker KI](https://www.darioamodei.com/essay/the-adolescence-of-technology)

---

 <div style=""padding:14px; height: auto;">
  <div style="margin-bottom:24px; text-align:center;">
    <b style="color:#A0A0A0; font-size: 1em;">FREUND & SPONSOR: BITGET</b>
 </div>
<!--kg-card-end: html-->
<figure class="kg-card kg-image-card"><a href="https://bankless.cc/BitGet"><img src="https://bankless.ghost.io/content/images/2026/01/image---2026-01-27T145504.871.png" class="kg-image" alt="" loading="lazy" width="1280" height="720" srcset="https://bankless.ghost.io/content/images/size/w600/2026/01/image---2026-01-27T145504.871.png 600w, https://bankless.ghost.io/content/images/size/w1000/2026/01/image---2026-01-27T145504.871.png 1000w, https://bankless.ghost.io/content/images/2026/01/image---2026-01-27T145504.871.png 1280w" sizes="(min-width: 720px) 720px"></a></figure><p>Gold und Silber erreichen neue Höchststände. <strong>Nutzen Sie die Dynamik auf Bitget</strong>: Handeln Sie 79 Makromärkte – Rohstoffe, Devisen und Indizes – direkt mit USDT. Diversifizieren Sie in einer App mit hoher Liquidität, geringem Slippage und einer Hebelwirkung von bis zu 500x, um verschiedenen Risikostilen gerecht zu werden.</p><div class="kg-card kg-button-card kg-align-center"><a href="https://bankless.cc/BitGet" class="kg-btn kg-btn-accent">Beginnen Sie mit dem Handel auf Bitget</a></div>