Principais Modelos de IA Falham em Testes de Conformidade co

Aithos Research Foundation lançou um estudo revelando que 12 dos principais modelos de inteligência artificial do setor falham consistentemente em atender aos requisitos do EU AI Act e do GDPR. A pesquisa utilizou a ferramenta LARA (Legal Assessment for Real-world Agents) para avaliar como esses sistemas lidam com ambientes de trabalho complexos. As descobertas indicam que mesmo os modelos mais avançados enfrentam dificuldades com a EU law compliance, frequentemente envolvendo-se em práticas proibidas, como pontuação social e inferência de estado emocional em contextos profissionais.

O estudo destaca uma lacuna significativa entre as capacidades atuais da IA e os rigorosos padrões regulatórios estabelecidos pelas autoridades europeias. O Claude Opus 4.7 surgiu como o modelo mais em conformidade entre os testados, mas alcançou apenas uma taxa de sucesso de 54%. Isso significa que mesmo o sistema de melhor desempenho falhou em quase metade dos cenários simulados do mundo real. Outros modelos proeminentes tiveram um desempenho consideravelmente pior, levantando preocupações para empresas que planejam implementar esses agentes no mercado europeu.

Lacunas de Desempenho na EU Law Compliance

Os dados do estudo da Aithos mostram um declínio acentuado na EU law compliance entre diferentes provedores. Enquanto a Anthropic liderou o grupo, o Gemini 3.1 Pro da Google conseguiu apenas uma taxa de conformidade de 10%. A situação foi ainda mais grave para modelos como Kimi K2.6 e Qwen 3.6 Plus, ambos os quais falharam em mais de 90% dos testes, registrando taxas de sucesso entre 7% e 9%. Essas falhas foram mais proeminentes em relação ao Artigo 5 do AI Act, que proíbe a exploração de populações vulneráveis e o monitoramento emocional não autorizado.

Para líderes empresariais, esses resultados representam um risco financeiro e operacional substancial. Sob o EU AI Act, empresas que violarem práticas proibidas podem enfrentar penalidades de até 7% do seu faturamento global total. A incapacidade dos modelos de fundação de se autorregularem ou de aderirem a esses limites legais sugere que a supervisão manual e camadas adicionais de segurança permanecem uma necessidade para qualquer implementação corporativa de IA na região.

As descobertas da Aithos Research Foundation sugerem que o caminho para o alinhamento regulatório total é mais longo do que muitos desenvolvedores previam. À medida que o prazo de 02-06-2026 para várias disposições do AI Act se aproxima, a pressão sobre a Anthropic, Google e outros desenvolvedores para refinar seus modelos está se intensificando. As organizações devem agora decidir se adiam a implementação ou se investem pesadamente em proteções personalizadas para mitigar os riscos identificados nesta última avaliação.

Embora busquemos a precisão, o bytevyte pode cometer erros. Os usuários são aconselhados a verificar todas as informações de forma independente. Não aceitamos qualquer responsabilidade por erros ou omissões.

✔Human Verified

Lacunas de Desempenho na EU Law Compliance

Related Articles