Beobachtungen.
Was gerade sichtbar wird — am Markt, in Studien und in Produktentscheidungen.
2026
-
Mehr Agents, gleiche Ergebnisse — Stanford + ehrliche Scope-Differenzierung
Ein einzelner KI-Agent mit demselben Rechenbudget liefert mindestens so gute Ergebnisse wie ein ganzes Team aus Agents. Häufig bessere. Eine Stanford-Gruppe hat das im April kontrolliert gezeigt.
-
Emmi AI + Mistral als Prüfstein für europäische Industrial AI
Hinter der Akquisition von Emmi AI durch Mistral steckt viel mehr als eine Startup-Erfolgsgeschichte.
-
Commerzbank legt KI-KPIs offen
Oliver Dörler, Chief Data & AI Officer der Commerzbank, hat sich Ende April in der Börsen-Zeitung auf klare Zahlen und KPIs zu KI festgelegt. Bis 2028 will die Bank 140 Millionen Euro in KI investieren, daraus 300 Millionen Wertbeitrag erzielen und den Personalstand dabei konstant bei 36.700 Vollzeitstellen halten.
-
Wissens-Flywheel: Das Gedächtnis macht den Unterschied
In zwei Jahren dürften viele Beratungsbetriebe denselben KI-Assistenten nutzen. Auf denselben Frontier-Modellen, mit vergleichbarer Funktionalität.
-
IAB-Betriebspanel: Adoption ohne Leitplanken
Jeder vierte deutsche Betrieb nutzt inzwischen generative KI. Klingt nach einer Erfolgsgeschichte. Bis man die zweite Zahlenreihe derselben Studie liest.
-
DSGVO als schärfere Klinge bei KI im Alltag
Die schärfste KI-Regelung im Alltag vieler Unternehmen steht nicht im AI Act. Sie steht in der DSGVO und gilt seit acht Jahren.
-
KI-Architektur: Anbieterwechsel muss möglich sein
Das beste KI-Modell hilft wenig, wenn man es nicht wechseln kann.
-
Shadow-KI und Schulungslücke: die Reihenfolge der Zahlen
Bitkom hat 1.003 Erwerbstätige in Deutschland zu KI im Beruf befragt. 48% nutzen sie. 21% haben jemals eine betriebliche Schulung dazu bekommen. 12% nutzen sie heimlich.
-
Ein Modell allein ist ein Risikoträger, kein Kontrollinstrument
Faktisch jede komplexe Aufgabe, die ich bisher einem KI-Modell gegeben habe, hat Mängel enthalten, in der überwiegenden Mehrheit substanzielle. Ich weiß das, weil ich das Ergebnis jeweils von einem zweiten Modell prüfen lasse.
-
Agents raten lieber als zu fragen — ProactiveBench + Frontier-Differenzierung
Ihr KI-Agent liefert lieber ein falsches Ergebnis als zuzugeben, dass ihm Daten fehlen. Für die meisten Modelle in freier Wildbahn stimmt das — auch wenn sich das Bild an der Spitze gerade verschiebt.
-
KI-Readiness-Selbsttest offen statt Lead-Gate
Viele "KI-Readiness-Tests" im Netz sind nur zur Hälfte Selbsttest. Ich habe mir in den letzten Tagen einige davon angesehen.
-
Aleph Alpha + Cohere — das eigentliche Signal ist nicht die Fusion
Europa hat bisher viele KI-Modelle gebaut. Was gefehlt hat: ein Anbieter, der nicht nur reguliert wird, sondern auch verkauft.
-
Verification Gap — warum KI Strategie strukturell nicht ersetzen kann
KI kann Code auf Senior-Niveau schreiben. Aber keine Strategie entwickeln. Das ist kein Zufall — und nach heutigem Stand der Technik auch kein Problem, das sich einfach mit mehr Rechenleistung lösen lässt.
-
Profitless Prosperity — 81% ohne messbaren KI-Erfolg
81% der Unternehmen, die KI einsetzen, sehen keinen messbaren Geschäftserfolg. Das sagt nicht ein Skeptiker. Das sagen McKinsey, Roland Berger, MIT, Bain und Deloitte — alle in den letzten Wochen, unabhängig voneinander.
-
Der Use-Case macht den Unterschied
Gleiche KI, gleiche Tools, gleiche APIs. Eines macht fast doppelt so viel Umsatz. Der Unterschied hat nichts mit Technologie zu tun.
-
Copilot aufgedreht — plötzlich sieht jeder alles
40% der IT-Verantwortlichen haben laut Gartner ihren Copilot-Rollout um drei Monate oder länger verschoben. Nicht weil Copilot versagt hat — sondern weil er genau das getan hat, wofür er gebaut wurde: Informationen finden.
-
Prompt Injection: Modellauswahl ist Sicherheitsentscheidung
Jemand schreibt einen einzigen Satz in ein Dokument. Das KI-System, das dieses Dokument bewertet, ändert daraufhin sein Urteil um 20 Prozentpunkte.
-
Klarna — Automatisieren. Scheitern. Anpassen.
"Wir haben zu stark auf Effizienz und Kosten fokussiert. Die Qualität hat gelitten." — Klarna CEO Siemiatkowski. Was nach KI-Scheitern klingt, ist das Gegenteil.
-
Secret Cyborgs — Ihr Geschäftsmodell bestraft Effizienz
Ihre Mitarbeiter nutzen bereits KI. Sie wissen es nicht — und Ihr Geschäftsmodell ist der Grund, warum Ihnen niemand davon erzählt.
-
Next-Gen-Modelle fertig — Vendor-Evaluierungen auf Sand gebaut
Wer gerade KI-Anbieter evaluiert, trifft Entscheidungen auf Basis von Modellen die in wenigen Monaten nicht mehr existieren.
-
Xiaomi Hunter Alpha — zahlt Europa das Achtfache für KI?
Zahlt Ihr Unternehmen das Achtfache für KI — ohne es zu wissen?
-
LLM-Homogenisierung — Warum Ihr LLM Sie durchschnittlich macht
ChatGPT macht Sie durchschnittlich. Nicht weil es schlecht ist — sondern weil es genau das tut, wofür es gebaut wurde.
-
Sollte der CFO KI führen und nicht der CTO?
Eine aktuelle HBR-Studie hat über 1.000 Unternehmen verglichen. Das Ergebnis ist erstaunlich klar: KI-Initiativen unter Finanzführung liefern in 76% der Fälle messbaren Geschäftswert. Unter IT-Führung sind es 53%.
-
KI-Agents in Production — die ersten dokumentierten Unfälle zeigen ein systemisches Muster
KI-Agenten im Unternehmen sind keine Pilotprojekte mehr. Sie treffen Entscheidungen, verändern Daten, greifen auf Systeme zu — mit denselben Berechtigungen wie der Mensch, der sie gestartet hat. Ohne Rückfrage. Ohne Limit.
-
3 Warnsignale, dass Ihr Unternehmen nicht KI-ready ist
"Wir müssen irgendwas mit KI machen."
-
KI-Agenten: Brillant bei klaren Aufgaben, aber nichts für Selbstbauer
Ein neuer Mitarbeiter fragt nach, wenn etwas unklar ist. Ein KI-Agent nicht. Er arbeitet mit dem was er bekommt — und liefert im Zweifel überzeugend klingende falsche Ergebnisse.
-
Ihre Daten sind nicht KI-ready — und das ist Ihr größter Hebel
McKinsey meldet: 88% der Unternehmen nutzen KI. Gleichzeitig sagt Gartner: 57% der Organisationen haben Daten, die nicht KI-ready sind. Das ist kein Widerspruch — das ist der Normalzustand.
-
Die Selbstfahrer-Frage — ab wann delegiert man an KI?
Selbstfahrende Autos haben weniger Unfälle als Menschen. Trotzdem sitzen wir am Steuer.
-
Halluzinationen: Wird messbar besser, aber man muss es wissen
Wissensarbeiter verbringen im Schnitt 4,3 Stunden pro Woche damit, KI-Antworten auf Richtigkeit zu prüfen. Nicht weil sie paranoid wären — sondern weil halluzinierte Antworten genauso überzeugend klingen wie richtige. Oft sogar überzeugender: Eine MIT-Studie zeigt, dass KI bei falschen Antworten selbstbewusstere…
-
Wo KI heute schon funktioniert — die Spec+DoD-Formel
Wenn man verstehen will, wo KI funktioniert und wo nicht, sind zwei Fragen essentiell: Kann man vorher präzise aufschreiben, was man will? Und kann man am Ende prüfen, ob das Ergebnis stimmt?
-
Die Software-Revolution, die niemand kommen sah
Ich komme aus der Softwareentwicklung und habe selbst ein Softwarehaus aufgebaut. Was in dieser Branche gerade passiert, habe ich in 30 Jahren nicht gesehen.
-
KI 2026: Warum dieses Jahr entscheidend ist
In Gesprächen mit Führungskräften erlebe ich gerade zwei Reaktionen auf KI: Unruhe, weil sie nicht wissen wo anfangen. Oder Gelassenheit, weil ChatGPT ja so einfach war.