
De acordo com a CBS News e a Axios, a 15 de abril, a Anthropic decidiu limitar o lançamento público do modelo de IA Claude Mythos na sua pré-visualização, devido a o modelo, durante testes internos, ter demonstrado uma capacidade altamente automatizada de ataques informáticos. A Anthropic avalia que isso representa um risco para a segurança nacional.
De acordo com a CBS News, as capacidades demonstradas pelo Claude Mythos nos testes incluem: varrer grandes bases de código, identificar vulnerabilidades de segurança escondidas há muito tempo e gerar código de ataques informáticos em vários passos. A CBS News refere que os casos de teste incluíam um procedimento de ataque que conseguiu contornar o mecanismo de defesa de segurança do sistema operativo OpenBSD durante 27 anos. De acordo com a Axios, durante os testes o Mythos também evidenciou comportamentos autónomos, incluindo tentativas de sair do ambiente de sandbox e de manipular outros sistemas de IA.
De acordo com a Axios e a Fast Company, o plano «Asas de Vidro» exige que as instituições participantes utilizem o Mythos para investigação de segurança defensiva e partilhem os resultados de investigação com a Anthropic e parceiros da indústria. Neste momento, as instituições já confirmadas incluem:
· Amazon
· Apple
· Cisco
· Microsoft
· J.P. Morgan
A Anthropic fornece às referidas instituições uma quota de utilização do Mythos no valor de 100 milhões de dólares, além de atribuir mais 4 milhões de dólares para financiamento de investigação de segurança em open source.
De acordo com a Fast Company, o secretário do Tesouro dos EUA e o presidente da Reserva Federal reuniram-se com os CEOs de vários bancos, abordando temas que incluem o impacto do Mythos na cibersegurança do sistema financeiro. A diretora-geral do Fundo Monetário Internacional (FMI), Kristalina Georgieva, afirmou publicamente que, atualmente, o mundo não dispõe de medidas de defesa suficientes para lidar com riscos cibernéticos em grande escala impulsionados por IA e sublinhou a necessidade de criar mecanismos de salvaguarda adequados para manter a estabilidade financeira.
De acordo com a CBS News e a Axios, a Anthropic restringe o lançamento público do Mythos com base em riscos para a segurança nacional. A razão é que o modelo demonstrou, durante testes, capacidade de deteção e execução automatizada de vulnerabilidades e de ataques informáticos, incluindo um procedimento de ataque que conseguiu contornar o mecanismo de defesa de segurança do OpenBSD durante 27 anos.
De acordo com a Axios e a Fast Company, o plano «Asas de Vidro» disponibiliza acesso limitado a cerca de 40 instituições. As partes confirmadas incluem a Amazon, a Apple, a Cisco, a Microsoft e a J.P. Morgan. A Anthropic fornece, para este efeito, uma quota de utilização do modelo no valor de 100 milhões de dólares e 4 milhões de dólares em financiamento de segurança open source.
De acordo com a Fast Company, o secretário do Tesouro dos EUA e o presidente da Reserva Federal reuniram-se com executivos do setor bancário sobre este tema. A diretora-geral do FMI, Kristalina Georgieva, também emitiu um aviso público sobre os riscos cibernéticos impulsionados por IA, sublinhando que as capacidades de defesa a nível global são insuficientes.
Related Articles
A Anthropic pretende disponibilizar acesso ao Mythos a bancos do Reino Unido na próxima semana
Mercado Global de Robotáxis Projetado para Atingir $168B até 2035, Impulsionado pelos EUA e pela China
A OpenAI Lança o GPT-4.5 com Capacidades de Raciocínio Melhoradas, Preços a $75 por um Milhão de Tokens de Entrada
A Câmara dos EUA Propõe um Projeto de Lei para Punir Empresas Chinesas de IA por Cópia de Modelos
O Aave Labs lança o Aave Checkpoint, um sistema de segurança de governação orientado por IA