-
Putin continuará fornecendo petróleo à Índia, apesar da pressão dos EUA
-
CEO do Softbank diz que uma super-IA pode transformar humanos em 'peixes' ou vencer o Nobel
-
OpenAI anuncia acordo para construir centro de IA na Austrália
-
Chuvas dificultam limpeza no Sri Lanka após inundações que atingiram vários países da Ásia
-
Empresas chinesas de óculos inteligentes buscam conquistar mercado mundial
-
UE abre investigação contra Meta por práticas contrárias à concorrência na IA do Whatsapp
-
Economia do Brasil avança no terceiro trimestre impulsionada pelo agro
-
Nintendo lança 'Metroid Prime 4', a esperada nova edição de sua saga de ficção científica
-
Indonésia e Sri Lanka em alerta por previsões de chuvas após inundações devastadoras
-
Previsões de chuva aumentam temores na Indonésia e Sri Lanka após inundações
-
Mais de 200 celebridades pedem libertação de líder palestino
-
Proliferação de satélites ameaça observação do céu com telescópios
-
Após apagão, Cuba inicia restauração gradual do serviço elétrico
-
Nomeado por Trump para Nasa reforça desejo de retornar à Lua antes da China
-
Boom dos data centers molda uma cidade dos EUA
-
Luxo 'Made in Italy' é alvo de investigações sobre suas subcontratadas
-
México anuncia redução da jornada de trabalho e aumento do salário mínimo
-
UE tem acordo para proibir gás russo a partir do fim de 2027
-
Airbus reduz meta de entregas para 2025 após problema em fuselagem do A320
-
Crianças traumatizadas pela guerra em Gaza são tratadas com realidade virtual
-
Médico recebe sentença por fornecer cetamina a Matthew Perry
-
YouTube afirma que crianças estarão 'menos seguras' com restrição australiana
-
Agência médica dos EUA reduzirá testes científicos em macacos
-
Amazon apresenta novo chip de IA para competir com Nvidia
-
'É pouco provável' que ex-príncipe Andrew receba compensação por mudança forçada
-
'Venha e me mate': o pedido das formigas doentes para salvar a colônia
-
OpenAI declara 'código vermelho' diante de forte concorrência ao ChatGPT
-
Como o desmatamento piorou as inundações na Indonésia
-
Países asiáticos lutam para distribuir ajuda após inundações que deixaram 1.300 mortos
-
OCDE eleva previsões de crescimento de 2025 para EUA, China e zona do euro
-
Apple anuncia a saída do diretor de IA da empresa
-
Samsung lança primeiro smartphone dobrável triplo
-
Verificação de idade com selfies, um sistema em ascensão para identificar menores na internet
-
Inundações devastadoras deixam mais de mil mortos na Ásia
-
Venezuela denuncia 'ameaça colonialista' após alerta de Trump sobre seu espaço aéreo
-
Max, a alternativa ao WhatsApp que divide os usuários na Rússia
-
Airbus intervém rapidamente nos modelos A320, mas cerca de 100 permanecem em solo
-
Airbus intervém rapidamente nos modelos A320, mas uma centena ficará em solo
-
Airbus pede suspensão de voos de 6 mil A320 para troca de programa de controle
-
Airbus pede suspensão de voos de 6 mil A320 para trocar programa de controle de voo
-
Rússia ameaça com proibição total do WhatsApp
-
Presidente alemão faz visita histórica a Guernica, bombardeada pelos nazistas
-
Emprego no Brasil resiste novamente às tarifas dos EUA
-
Proibição da carne de cachorro gera controvérsia em Jacarta
-
Pior incêndio em décadas deixa mais de 90 mortos em Hong Kong
-
Louvre aumentará em 45% preço do ingresso para visitantes extraeuropeus
-
Três astronautas europeus participarão de missões à Lua
-
Ovo Fabergé avaliado em R$ 133,7 milhões será leiloado em Londres
-
Hong Kong procura centenas de desaparecidos após incêndio que deixou 75 mortos
-
O que se sabe sobre o suspeito do ataque a tiros contra soldados em Washington
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
C.Peyronnet--CPN