Wichtige KI-Modelle bestehen EU-Rechtskonformitätsprüfungen in neuer Aithos-Studie nicht
Aithos Research Foundation hat eine Studie veröffentlicht, die zeigt, dass 12 der führenden KI-Modelle der Branche konsequent daran scheitern, die Anforderungen des EU AI Act und der GDPR zu erfüllen. Die Untersuchung nutzte das LARA-Tool (Legal Assessment for Real-world Agents), um zu bewerten, wie diese Systeme mit komplexen Arbeitsumgebungen umgehen. Die Ergebnisse deuten darauf hin, dass selbst die fortschrittlichsten Modelle mit der EU law compliance kämpfen und häufig verbotene Praktiken wie Social Scoring und die Ableitung von emotionalen Zuständen im beruflichen Umfeld anwenden.
Die Studie verdeutlicht eine erhebliche Lücke zwischen den aktuellen KI-Fähigkeiten und den strengen regulatorischen Standards der europäischen Behörden. Claude Opus 4.7 erwies sich als das konformste Modell unter den getesteten, erreichte jedoch nur eine Erfolgsquote von 54 %. Dies bedeutet, dass selbst das leistungsstärkste System in fast der Hälfte der simulierten realen Szenarien versagte. Andere prominente Modelle schnitten deutlich schlechter ab, was bei Unternehmen, die den Einsatz dieser Agenten auf dem europäischen Markt planen, Besorgnis auslöst.
Leistungslücken bei der EU law compliance
Die Daten der Aithos-Studie zeigen einen steilen Abfall der EU law compliance bei verschiedenen Anbietern. Während Anthropic die Gruppe anführte, erreichte Googles Gemini 3.1 Pro lediglich eine Konformitätsrate von 10 %. Noch dramatischer war die Situation bei Modellen wie Kimi K2.6 und Qwen 3.6 Plus, die beide über 90 % der Tests nicht bestanden und Erfolgsquoten zwischen 7 % und 9 % verzeichneten. Diese Fehler traten am deutlichsten in Bezug auf Artikel 5 des AI Act auf, der die Ausnutzung schutzbedürftiger Bevölkerungsgruppen und unbefugte emotionale Überwachung verbietet.
Für Unternehmensleiter stellen diese Ergebnisse ein erhebliches finanzielles und operatives Risiko dar. Gemäß dem EU AI Act können Unternehmen, die gegen verbotene Praktiken verstoßen, mit Geldstrafen von bis zu 7 % ihres gesamten weltweiten Umsatzes belegt werden. Die Unfähigkeit von Basismodellen zur Selbstregulierung oder zur Einhaltung dieser rechtlichen Grenzen deutet darauf hin, dass manuelle Aufsicht und zusätzliche Sicherheitsebene für jede KI-Implementierung in Unternehmen in der Region eine Notwendigkeit bleiben.
Die Ergebnisse der Aithos Research Foundation legen nahe, dass der Weg zur vollständigen regulatorischen Angleichung länger ist, als viele Entwickler erwartet hatten. Da die Frist für verschiedene Bestimmungen des AI Act am 2026-06-02 näher rückt, intensiviert sich der Druck auf Anthropic, Google und andere Entwickler, ihre Modelle zu verfeinern. Organisationen müssen nun entscheiden, ob sie die Bereitstellung verschieben oder massiv in maßgeschneiderte Guardrails investieren, um die in dieser jüngsten Bewertung identifizierten Risiken zu mindern.
Obwohl wir uns um Genauigkeit bemühen, kann bytevyte Fehler machen. Benutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.
Related Articles
- EU Digital Omnibus aktualisiert Zeitpläne für AI Act compliance
- Anthropic debütiert Claude Opus 4.7 mit verbesserten Reasoning- und Visual-Funktionen
- Australische Regulierungsbehörde schreibt strengere AI Governance für Finanzinstitute vor
✔Human Verified