03.05.2026 KI-Radar

KI-Radar — 3. Mai 2026

KI-generiert aus der täglichen Marktbeobachtung. Redaktionell kuratiert, aber nicht Satz-für-Satz lektoriert — zur Orientierung gedacht, nicht als zitierfähige Quelle.

Frontier-Modelle versagen systematisch bei neuen, unbekannten Problemen — und Grok 4.3 kauft Marktrelevanz über Preissenkung, nicht über Capability-Fortschritt. Dazu: OpenAIs Tracking-Ausweitung macht ChatGPT als Enterprise-Default riskanter, und ein chinesisches Gericht setzt den ersten Arbeitsrechtspräzedenz zu KI-Substitution.

Frontier-Modelle scheitern strukturell an neuen, unbekannten Problemen

Die ARC Prize Foundation analysierte 160 Replays von GPT-5.5 (0,43% Lösungsrate, rund $10.000 Benchmark-Kosten) und Claude Opus 4.7 (0,18%) auf einem Benchmark, den Menschen ohne Training zu 100% lösen. Drei systematische Fehlermuster: Modelle verbinden korrekte Teilmechaniken nicht zur Gesamtlösung, projizieren Trainingsanalogien auf völlig neue Umgebungen, und ein gelöster Level verstärkt eine falsche Theorie statt sie zu widerlegen. Wer KI für agentic Workflows einkauft, braucht eigene, aufgabenspezifische Evaluationen — publizierte Benchmark-Scores messen nicht das, was in unbekannten Prozessen bricht.

xAI senkt mit Grok 4.3 die Preise, nicht die Capability-Lücke

xAI halbiert die Kosten: Input −40%, Output −60% gegenüber Grok 4.2 — der Benchmark-Run kostet damit $395, gegen $3.959 für GPT-5.5 und $4.811 für Claude Opus 4.7. Der Capability-Abstand bleibt: Intelligence Index 53 gegen 60 für GPT-5.5, auf GDPval-AA (reale Knowledge-Work-Aufgaben) liegt Grok 4.3 noch 276 Elo-Punkte zurück; hinzu kommen gemeldete „Narkolepsie-Probleme" im agentic Betrieb. Für preissensitive Batch-Workloads ist Grok 4.3 jetzt eine ernsthafte Option — der Preis ist kein Proxy für Zuverlässigkeit in kritischen Tasks.

OpenAIs Monetarisierungsdruck macht ChatGPT als Enterprise-Default riskanter

OpenAI schaltet seit Mai 2026 Tracking-Cookies für Free-User in Werbemärkten standardmäßig ein; über 90% der ChatGPT-Nutzer sind auf dem Free-Tier, Werbeeinnahmen laufen seit Februar 2026. Parallel räumte Musk im laufenden Prozess ein, dass xAI OpenAI-Modelle „teilweise" destilliert hat — ein Urteil, das OpenAIs geplanten IPO bei einer Valuation von $800 Mrd. gefährden könnte. Die Kombination aus Governance-Unsicherheit, Tracking-Ausweitung und offenem IPO-Status erhöht den Prüfaufwand für Unternehmen, die ChatGPT als zentrale Plattform im Einsatz haben oder evaluieren.

China setzt Arbeitsrechtspräzedenz: KI-Substitution allein trägt juristisch nicht

Chinesische Gerichte entschieden, dass die bloße Ersetzung eines Mitarbeiters durch KI kein ausreichender Rechtsgrund für eine Kündigung ist — eine der ersten derartigen Entscheidungen weltweit. KI-Deployment-Projekte mit direkter Personalwirkung brauchen damit eine eigenständige arbeitsrechtliche Begründung neben der technologischen Substitutionslogik. Eine analoge Entwicklung unter europäischem Arbeitsrecht ist plausibel — HR, Legal und KI-Projektteams sollten diesen Präzedenzfall in laufende Deployment-Planungen einbeziehen.

Meta setzt auf offene Humanoid-Robotik als nächste Plattformwette

Meta akquiriert Assured Robot Intelligence mit dem erklärten Ziel einer offenen Humanoid-Roboter-Plattform — eine „Android-für-Roboter"-Strategie. Der unmittelbare Enterprise-Impact ist gering; relevant ist die Prioritätenangabe: Meta investiert neben Modellentwicklung substanziell in physische KI-Infrastruktur. Wer Meta als KI-Partner oder Open-Source-Quelle in der Roadmap bewertet, sollte diese Verschiebung im Kontext des Gesamtbudgets einordnen.

#Benchmark #Vendor-Landschaft #Governance #Beschäftigungsrecht #Robotik

← Alle Radar-Einträge · Beobachtungen