31.03.2026 KI-Radar

KI-Radar — 31. März 2026

KI-generiert aus der täglichen Marktbeobachtung. Redaktionell kuratiert, aber nicht Satz-für-Satz lektoriert — zur Orientierung gedacht, nicht als zitierfähige Quelle.

Stanford zeigt, dass multimodale Modelle bis zu 80% ihrer Benchmark-Scores ohne Bild-Input erreichen, das EU-Parlament verabschiedet das Nudifier-Verbot — und Karsten Wildberger erklärt das 30-Jahres-Jobversprechen öffentlich für beendet.

Stanford „Mirage Effect“ entkernt multimodale Benchmarks

Multimodale Frontier-Modelle erzielen 70–80% ihrer Benchmark-Scores ohne jedes Bild-Input. Der Phantom-0-Benchmark dokumentiert 60–100% fabrizierte visuelle Details — in der medizinischen Domäne generiert KI Diagnosen wie STEMI, Melanom und Karzinom für Bilder, die gar nicht existieren. Für jede KI-Beschaffung im Gesundheitsbereich oder für multimodale API-Integrationen: Publizierte Scores sind nicht verlässlich, eigene Blind-Tests sind Pflicht.

HorizonMath setzt die Messlatte — GPT-5.4 Pro erreicht 7%

Der neue kontaminationssichere Mathe-Benchmark mit 100 ungelösten Problemen zeigt GPT-5.4 Pro bei 7%, Opus 4.6 und Gemini 3.1 Pro bei je 3%. Bemerkenswert ist weniger das absolute Niveau als die Größenordnung: Wer „Reasoning“ in Enterprise-Produkten bewirbt, sollte diese Werte als Realitätsanker in seinem Pitch einkalkulieren.

EU-Parlament verabschiedet Nudifier-Verbot, Kennzeichnungspflicht bis November

Das Plenum stimmt mit überwältigender Mehrheit für das Nudifier-Verbot, die Kennzeichnungspflicht für KI-Inhalte greift bis November. Die Zustimmung der EU-Staaten steht noch aus. Parallel veröffentlicht der Bundesrat eine kritische Stellungnahme zum EU Digital Omnibus. Medien- und Consumer-Content-Produzenten brauchen die Content-Provenance-Architektur bis Q3, nicht erst zum Compliance-Stichtag.

Microsoft Copilot Wave 3 liefert „Model Council“

Die Researcher- und Critique-Funktion kombiniert Anthropic- und OpenAI-Modelle in Dual-Model-Review, ein „Model Council“ erlaubt Side-by-Side-Vergleich mehrerer Anbieter. 7-Punkte-Vorsprung gegenüber Perplexity im internen Benchmark. Für M365-Rollouts ist das die erste Generation Copilot-Features, die einen Multi-Vendor-Ansatz als Produktstärke einsetzt — Vendor-Lock-in-Argumente werden damit schwächer.

Wildberger erklärt das 30-Jahres-Jobversprechen für beendet

Karsten Wildberger (Bild am Sonntag): Programmierjobs fallen weg, das 30-Jahres-Jobversprechen ist vorbei, Lifelong Learning ist Pflicht, „nicht teilnehmen keine Option“. Das ist die klarste Positionierung eines DAX-CEOs zur KI-Jobtransformation bislang. Re-Skilling-Budgets bekommen damit politische Rückendeckung, die vor sechs Monaten noch schwer zu rechtfertigen war.

70% der Musikprofis nutzen KI, Rechtslage bleibt offen

Eine Sonarworks/Rolling-Stone-Erhebung zeigt: 70% der Musikprofis nutzen KI, über 50% der Sample-basierten Hip-Hop-Tracks sind laut Young Guru KI-generiert. Major Labels verfügen über keine zuverlässige KI-Musik-Erkennung. Audio-Content-Pipelines (Werbung, Branding, Produkt-Sonifikation) brauchen Supply-Chain-Klauseln in Lieferantenverträgen — kreative Zulieferungen sind nicht mehr ungeprüft einsetzbar.

#Benchmarks #Governance #EU #DACH #Arbeitsmarkt

← Alle Radar-Einträge · Beobachtungen