-
Grupo petroquímico Dow cortará 4.500 postos de trabalho
-
Diante da pressão ocidental, Irã ameaça com 'resposta esmagadora'
-
Trump lida com consequências de ataque armado em Minneapolis, dois agentes de imigração são suspensos
-
Samsung registra lucro trimestral recorde graças à demanda por chips de IA
-
Nasa prevê lançamento de missão para troca de astronautas da ISS em 11/2
-
Lula defende soberania do Panamá sobre o Canal, questionada por Trump
-
Copom mantém taxa Selic em 15%, mas prevê 'flexibilização'
-
SpaceX quer fazer IPO em data que coincida com alinhamento planetário e aniversário de Musk
-
Trump adverte prefeito de Minneapolis sobre migração e tensão volta a escalar
-
Fed mantém taxas de juros inalteradas e desafia pressão de Trump
-
Irã adverte que 'vai responder como nunca' em caso de ataque dos EUA
-
Uma das últimas sobreviventes do Holocausto alerta para ressurgimento do antissemitismo
-
Mundo não está preparado para o aumento do calor extremo, dizem cientistas
-
Suécia planeja proibir celulares em escolas de níveis fundamental e médio
-
Amazon corta 16 mil empregos como parte de estratégia para investir em IA
-
Japão ainda está longe de alcançar a paridade de gênero nas eleições legislativas
-
Petróleo brasileiro gera inveja e debate na Guiana Francesa
-
Otan deve se tornar mais europeia, afirma chefe da diplomacia da UE
-
América Latina e Caribe impulsionam plano de ajuda ao Haiti
-
Senado dos EUA convoca chefes das principais agências migratórias
-
Celebridades convocam protestos contra ações da polícia migratória dos EUA
-
Bombardeios russos na Ucrânia matam 11 pessoas e atingem trem de passageiros
-
Melania Trump faz 'apelo à unidade' após mortes em Minneapolis
-
Bombardeios russos na Ucrânia matam ao menos 10 pessoas e atingem usinas energéticas
-
UE ajudará Google a abrir Android para serviços de IA concorrentes
-
Califórnia investiga TikTok por censurar críticas a Trump
-
Adani e Embraer anunciam acordo para fabricar aviões na Índia
-
Indignação na Itália por participação de divisão do ICE nos Jogos Olímpicos de Inverno
-
Grande tempestade de inverno deixa pelo menos 30 mortos nos EUA
-
Blazy estreia na alta-costura e exalta a natureza para a Chanel
-
'Nossas crianças serão as próximas', temem quenianos enquanto a seca devasta o gado
-
Trump afirma que Irã quer negociar enquanto porta-aviões americano chega ao Oriente Médio
-
UE e Índia assinam acordo comercial histórico após duas décadas de negociações
-
Prefeito de Minneapolis anuncia a saída de 'alguns' agentes de imigração e Trump modera seu discurso
-
Victoria Beckham é condecorada na França em meio a problemas familiares
-
Kanye West nega ser 'nazista' ou 'antissemita' e fala sobre seu transtorno mental
-
Gigante dos videogames Ubisoft planeja cortar 'até 200 postos' de trabalho na França
-
Trump baixa o tom e anuncia colaboração com governador de Minnesota após morte de civis
-
Novo estilista da Dior aposta em flores para sua estreia na Semana de Alta-Costura de Paris
-
Juíza federal avalia suspender campanha da polícia migratória em Minneapolis
-
América Latina e Caribe buscam plano de ajuda para Haiti após tentativa fracassada da ONU
-
Grande tempestade de inverno deixa ao menos 11 mortos nos EUA
-
Ouro ultrapassa marca histórica de US$ 5.000 em meio à incerteza sobre Trump
-
Cúpula do Mar do Norte na Alemanha é marcada por tensões no Ártico
-
França decreta prisão preventiva para capitão de navio suspeito de fazer parte da 'frota fantasma' russa
-
Apagões, voos cancelados, supermercados vazios: tempestade causa estragos nos EUA
-
Forte tempestade de inverno atinge os EUA
-
'O Agente Secreto' repercute no mundo porque fala sobre uso do poder para 'esmagar', diz Kleber Mendonça Filho
-
Milhares de ativistas antiaborto marcham nos EUA: 'A luta não acabou'
-
Autoridades dos EUA se defendem após detenção de criança de 5 anos em operação contra imigrantes
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
C.Peyronnet--CPN