KI-Radar — 5. Mai 2026

KI-generiert aus der täglichen Marktbeobachtung. Redaktionell kuratiert, aber nicht Satz-für-Satz lektoriert — zur Orientierung gedacht, nicht als zitierfähige Quelle.

Benchmarks zeigen KI-Agenten bei 64% autonomer ML-Forschungsleistung und 52-fachem Trainingsbeschleuniger; OpenAI benennt menschliche Aufmerksamkeit als eigentliche Skalierungsbarriere. Big-Tech-Capex erreicht $720 Mrd. und treibt Banken an systemische Risikolimits — beide Modell-Anbieter treten mit milliardenschweren Deployment-Gesellschaften direkt als Beratungskonkurrenten auf.

KI automatisiert ML-Forschung: 64% autonom, 52-facher Trainingsbeschleuniger

Jack Clarks „Benchmark-Mosaic" (Import AI 455) liefert vier Messpunkte: SWE-Bench Verified auf 93,9% (2023: 2%), CORE-Bench vollständig gelöst mit 95,5%, MLE-Bench bei 64,4% (Oktober 2024: 16,9%), LLM-Training-Speedup 52×. Ein 23-jähriger Mathematiklaie löste per Single-Prompt ein 60 Jahre offenes Erdős-Problem, indem die KI den etablierten Fachansatz ignorierte und über Wahrscheinlichkeitstheorie einen kürzeren Weg fand. Evaluierungen auf Modellständen, die älter als sechs Monate sind, bilden die tatsächliche Leistung nicht mehr ab; Modell-Refresh-Zyklen gehören in die Governance.

Menschliche Aufmerksamkeit ist das nächste Skalierungsproblem

OpenAI Symphony verwandelt Linear in ein Agent-Kontrollzentrum: Agents ziehen eigenständig Tickets, führen Tasks durch und schließen Issues ohne menschliche Trigger. OpenAI benennt den Engpass explizit: Menschen supervisieren maximal 3 bis 5 parallele Agent-Sessions gleichzeitig. Governance-Modelle, die menschliche Freigabe pro Agent-Schritt voraussetzen, skalieren nicht über eine Handvoll Deployments hinaus; wer mehr Automatisierungstiefe will, muss die Aufsichtsarchitektur neu denken.

$720 Mrd. Capex — Bankenstress als Frühindikator

Google, Amazon, Microsoft und Meta investieren 2026 zusammen rund $720 Mrd. in KI-Infrastruktur, +70% gegenüber 2025 ($410 Mrd.), Q1 allein $130 Mrd. Oracle nimmt für neue Rechenzentren in Texas und Wisconsin einen $38-Mrd.-Kredit auf; JPMorgan und Morgan Stanley nähern sich internen Risikolimits und tätigen Significant Risk Transfers (SRTs), um Kapitalanforderungen zu senken. Wer KI-Infrastrukturprojekte mit Fremdkapital plant, sollte einkalkulieren, dass Banken für Großvolumina zunehmend selektiver werden.

OpenAI und Anthropic bauen eigene Deployment-Gesellschaften

OpenAI hat eine Enterprise-Deployment-Gesellschaft mit mehr als $4 Mrd. Kapital aufgesetzt, mit General Atlantic und Apollo Global als Investoren; Anthropic folgt demselben Muster mit eigener Venture-Einheit (General Atlantic, Apollo Global, Sequoia), CFO Rao: Nachfrage habe die Kapazität „deutlich übertroffen". Beide Anbieter zielen auf regionale Healthcare-Netzwerke und mittelgroße Hersteller. Wer als externer Berater KI-Rollouts verkauft, konkurriert künftig mit Deployment-Einheiten, die Deals direkt finanzieren können; das beschleunigt Make-or-Buy-Entscheidungen über externe Beratungspartner erheblich.

SAP setzt mehr als €1 Mrd. auf vertikale Foundation Models

SAP hat Prior Labs für mehr als €1 Mrd. mit Vier-Jahres-Commitment akquiriert, für task-spezifische Foundation Models, und dazu Dremio für Datenintegration übernommen. SAP tritt damit direkt gegen Salesforce, Microsoft und Oracle an, die alle eigene Vertical-AI-Plays aufbauen. In SAP-Umgebungen ist die strategische Frage nicht mehr „KI einführen oder nicht", sondern „SAP-native Komponenten oder Drittanbieter integrieren" — mit wachsendem Lock-in-Risiko auf beiden Seiten.

Deutsche KI-Startups: 58% des VC-Markts — und ein solider DACH-Praxisfall

Deutsche Startups haben Q1 2026 €1,7 Mrd. eingesammelt (+6% vs. Q1 2025), ohne Megadeal-Effekt; KI-Startups stellen 58% des Gesamtvolumens (71 Runden, €967 Mio.) gegenüber dem 2025-Schnitt von 43%. Mehr als 75% der Mittel stammen aus dem Ausland; strukturell bleibt die Lücke: €90 VC pro Einwohner in Deutschland vs. €510 in den USA. Barmenia Gothaer (mehr als 8 Mio. Kunden) erreichte mit KI-Voicebot Parloa und Genesys Cloud eine Routing-Quote von 89%, entlastet täglich mehr als 1.000 Anrufe und erzielt messbar höheren NPS. Klare Metriken, kein Hype.

← Alle Radar-Einträge · Beobachtungen