-
Nova Jersey homenageia Bruce Springsteen com museu
-
UE proibirá companhias aéreas de cobrar de pais para sentarem ao lado dos filhos
-
Medalha de Pelé da Copa de 1958 será leiloada na Inglaterra
-
Rivalidade com a China estará em pauta na cúpula do G7 na França
-
SpaceX tem estreia recorde na Bolsa de Valores
-
França se despede de menina cujo suposto assassinato chocou o país
-
OIT adota primeiro acordo internacional sobre trabalhadores de plataformas digitais
-
Inflação subiu em maio, apesar das medidas de Lula para conter os preços dos combustíveis
-
Queda da ajuda internacional coloca luta contra HIV em risco, diz ONU
-
Princesa da Tailândia morre após três anos internada
-
SpaceX se prepara para abrir capital e quebrar todos os recordes
-
Airbus impulsiona aliança com Alemanha para fabricar caça de 6º geração
-
Seis pessoas são detidas em Hong Kong em caso de falsificação de produtos da Copa do Mundo
-
BCE eleva suas taxas de juros a 2,25% devido à inflação pela guerra no Irã
-
Fenômeno El Niño já começou, anuncia agência climática dos EUA
-
BM reduz projeção de crescimento da América Latina por incerteza energética
-
Bonecas com IA cuidam de idosos na Coreia do Sul
-
'Não há ebola aqui': desinformação dificulta luta contra epidemia na RD Congo
-
Grande expectativa pela estreia da SpaceX na Bolsa
-
A escola da Ópera de Paris e o ensino francês do balé clássico
-
Papa denuncia a 'indiferença' com os imigrantes em ato simbólico nas Canárias
-
Robôs de limpeza saem dos laboratórios e começam a trabalhar nas casas chinesas
-
Trabalhadores indianos treinam robôs de IA com vídeos de atividades humanas
-
Primeira bolsa de couro feita a partir de células de T-Rex vai a leilão
-
Para além de gols e vitórias: histórias e imagens de quase um século de Copa do Mundo
-
Ícone do pop francês Patrick Bruel é acusado de estupro e agressão sexual
-
Chefe da Nasa defende tripulação da missão Artemis III, composta apenas por homens
-
Mais do que fincar uma bandeira, o plano é 'viver' na Lua, diz cientista da Nasa sobre Artemis
-
Inflação dos EUA sobe ao nível mais alto em três anos e pressiona Trump
-
Valeria, uma jovem ucraniana que enfrenta as cicatrizes psicológicas da guerra
-
Suspeito de ataque em Belfast comparece a tribunal após noite de violência
-
Árbitro impedido de entrar nos Estados Unidos é recebido como herói na Somália
-
Nova companhia aérea saudita inicia operações durante guerra no Oriente Médio
-
Filho do cineasta Rob Reiner, acusado de matar os pais, reivindica fundos da família
-
"Espero que tenha algo italiano no menu", diz piloto da Artemis III
-
Italiano Luca Parmitano será 1º europeu a integrar missão Artemis
-
Nintendo anuncia remake do jogo 'The Legend of Zelda: Ocarina of Time'
-
Fora da Copa do Mundo, China volta atenção ao árbitro Ma Ning
-
OpenAI dá o primeiro passo rumo à sua estreia na Bolsa nos EUA
-
Empresários e sindicatos suíços se unem contra proposta de limitar a imigração
-
Trump afirma que negociação de acordo de paz com o Irã está na 'fase final'
-
Irã e Israel suspendem hostilidades, mas ameaças persistem
-
Smartphones podem se responsáveis por queda da taxa de natalidade, apontam estudos
-
Milei defende IA desregulada após alerta de historiador Harari
-
México promete abertura de Copa do Mundo de 'paz', em meio a protestos
-
Apple relança sua IA com ajuda do Google
-
Aumenta pressão na França para combater abusos sexuais contra crianças
-
'Foi espancado até a morte!': abuso militar no combate ao narcotráfico no Equador
-
Lassana Diarra chega a acordo com Fifa sobre direitos de transferência
-
UE aprova primeiro tratamento contra câncer com injetor portátil
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
C.Peyronnet--CPN