03.04.2026 KI-Radar

KI-Radar — 3. April 2026

KI-generiert aus der täglichen Marktbeobachtung. Redaktionell kuratiert, aber nicht Satz-für-Satz lektoriert — zur Orientierung gedacht, nicht als zitierfähige Quelle.

Software-Optimierung allein bringt 2,7-fache Leistung auf gleicher Hardware, AMD bricht in Single-Node-Setups erstmals die Eine-Million-Token-Marke, Google liefert Gemma 4 unter Apache 2.0 — und Agent Skills werden zum organisatorischen Standard mit über 44 Tool-Implementierungen.

Software-Optimierung wird zum eigenen Hebel — 2,7x auf gleicher Hardware

MLPerf Inference v6.0: Nvidia GB300-NVL72 erreicht 2,7x Performance-Sprung auf DeepSeek-R1 — ohne Hardware-Wechsel, nur durch Software-Optimierung. Die 288-GPU-Konfiguration liefert 2,49 Mio. Tokens pro Sekunde. Das verändert TCO-Berechnungen fundamental: Wer Hardware-Investitionen heute auf Basis aktueller Performance-Werte rechtfertigt, plant gegen ein Ziel, das sich unter den Füßen verschiebt — und braucht für KI-Beschaffungsentscheidungen anbieterneutrale Benchmark-Interpretation.

AMD MI355X durchbricht erstmals 1 Mio. Tokens pro Sekunde

AMD matched Nvidia B200 in Single-Node-Setups und überschreitet erstmals die Eine-Million-Token-Marke. Damit ist Nvidia in der Single-Node-Klasse nicht mehr alternativlos, auch wenn Scale-Out weiterhin die Domäne von NVLink bleibt. Für Compute-Beschaffung jenseits der Hyperscaler-Verträge öffnet sich ein zweiter Verhandlungspartner — und damit eine Verhandlungsposition, die es zwölf Monate lang nicht gab.

Google Gemma 4 mit echter kommerzieller Freiheit unter Apache 2.0

Vier Modelle von 2B bis 31B, das 31B landet auf Platz 3 im Arena AI Text Leaderboard — bei einem Zwanzigstel der Parameterzahl der Frontier-Closed-Modelle. Für regulierte Branchen, On-Premise-Deployments und alle Use Cases, in denen Cloud-APIs nicht in Frage kommen, ist das die erste echte Option mit Frontier-nahem Niveau und unmissverständlicher Lizenz. Souveränitätsstrategien in DACH bekommen damit ein konkretes Bauteil.

Agent Skills werden organisatorischer Standard — 44 Tools, erste Enterprise-Adoption

Über 44 Tools unterstützen mittlerweile das Skill-Format, erste Enterprise-Kunden bauen interne Skill-Bibliotheken mit Hackathons und Governance-Layern auf. Skills werden damit zu einem organisationsspezifischen Asset — vergleichbar mit dem Übergang von Einzel-Makros zu zentral verwalteten RPA-Bibliotheken vor zehn Jahren. Für KI-Beratungsmandate ist eine kuratierte Skills-Bibliothek ab sofort ein konkret beauftragbares Deliverable, kein Forschungsthema.

EU verbietet KI-generierte Inhalte in offizieller Kommunikation — Kalifornien zieht nach

EU-Kommission, Parlament und Rat haben KI-generierte Bilder und Videos in offizieller Kommunikation vollständig untersagt. Parallel weitet Kalifornien per Newsom-Dekret seine KI-Regeln auf alle Unternehmen mit Geschäftsbeziehung in den Bundesstaat aus — explizit zu CSAM, Deepfakes, Diskriminierung, Bias. Die regulatorische Doppelfront EU/Kalifornien erhöht den Compliance-Druck auf jedes B2B-Unternehmen mit beidseitiger Exposition; KI-Content-Policies gehören in jede Marketing- und Kommunikations-Governance.

China hält 41% des heimischen KI-Beschleuniger-Marktes

Chinesische Chiphersteller kontrollieren mittlerweile 41% des inländischen Marktes für KI-Beschleuniger — vor zwei Jahren war diese Zahl noch nahezu Null. Die Verschiebung passiert nicht in Quartalen, sondern in Halbjahren. Wer Compute-Abhängigkeiten zu China im Risikoregister führt, kann diesen Wert von „Risiko“ auf „Ist-Zustand“ verschieben.

#Compute #OpenSource #Agents #Vendor-Landschaft #Governance

← Alle Radar-Einträge · Beobachtungen