-
Zelensky denuncia 'chantagem' europeia para reabrir oleoduto que transporta petróleo russo
-
Irã adverte que se outros países intervierem a guerra se ampliará
-
Trump diz que ainda não há condições para acordo com Irã
-
Trump quer envolvimento internacional para garantir tráfego no Estreito de Ormuz
-
Quem vai levar o Oscar de Melhor Filme? Confira os dez indicados
-
Fornecimento de gás é retomado no Peru após semanas de racionamento
-
Fortes explosões abalam o Irã durante manifestação com autoridades
-
Petróleo segue acima de US$ 100 e bolsas europeias fecham em queda
-
Canadá constrói novo quebra-gelo para reforçar presença no Ártico
-
Petróleo recua levemente, mas se mantém perto dos 100 dólares
-
Fortes explosões abalam Teerã
-
Petróleo fecha no nível mais alto desde 2022 depois que Irã prometeu que Estreito de Ormuz permanecerá fechado
-
Tinder busca ir além do 'swipe' para oferecer conexões 'mais relevantes'
-
Nasa se diz pronta para lançar Artemis 2 à Lua a partir de 1º de abril
-
Governo tenta conter alta no preço dos combustíveis por guerra no Oriente Médio
-
Por que os preços do petróleo sobem apesar da liberação recorde de reservas?
-
Chileno vence o prêmio Pritzker de arquitetura de 2026
-
Novo líder supremo do Irã defende que Estreito de Ormuz permaneça fechado
-
Cotação do petróleo volta a superar 100 dólares temporariamente
-
EUA anuncia investigações comerciais que podem abrir caminho para novas tarifas
-
Países da AIE liberam 400 milhões de barris de petróleo de suas reservas estratégicas
-
Inflação nos EUA se mantém estável em fevereiro, a 2,4% interanual
-
Trump foi 'positivo' para o setor financeiro nos EUA, diz CEO do Nubank
-
Quatro navios atacados na região do Estreito de Ormuz, foco de preocupação mundial
-
EUA faz novas ameaças ao Irã, que busca paralisar comércio de petróleo
-
Musk duplica sua fortuna e se mantém como o mais rico do mundo, segundo Forbes
-
Explosões sacodem Teerã após promessa dos EUA de intensificar ataques
-
Petróleo despenca e impulsiona alta das bolsas
-
Jovens cineastas que sonham com Oscar veem IA como um atalho
-
Startup de IA arrecada US$ 1 bilhão e busca 'mudança de paradigma'
-
Volkswagen cortará 50 mil empregos na Alemanha até 2030
-
Dezenas de civis mortos no Haiti por ataques de drones usados contra gangues
-
Blazy oferece uma viagem no tempo através do icônico tailleur da Chanel
-
Petróleo modera sua alta e Wall Street se recupera graças a Trump
-
EUA patrulha espaço aéreo da Venezuela com caças
-
Anthropic processa o governo dos EUA por disputa sobre o uso de sua IA
-
Empresas mexicanas denunciam medidas dos EUA que corroem T-MEC
-
Live Nation chega a acordo com governo dos EUA em caso antimonopólio
-
G7 considera liberar reservas estratégicas de petróleo, mas 'ainda não'
-
Barril de petróleo supera os US$ 100
-
Sob intensos bombardeios, Irã define sucessor de Ali Khamenei
-
IA, componente essencial da guerra que ainda levanta dúvidas
-
Trump diz que apenas 'rendição incondicional' do Irã pode encerrar a guerra
-
Provedora de imagens de satélite reterá por 96 horas fotos de países do Golfo atacados
-
Guerra no Oriente Médio impulsiona barril Brent e WTI para mais de US$ 90
-
Três ex-presidentes dos EUA se reúnem em homenagem a Jesse Jackson
-
EUA perde empregos, mas Casa Branca considera que economia segue 'forte'
-
Guerra no Oriente Médio impulsiona barril de petróleo para mais de US$ 90
-
Austrália obriga sites pornográficos a bloquear acesso de menores de 18 anos a partir de segunda-feira
-
Jogos Paralímpicos de Inverno começam com a Rússia e polêmicas
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
C.Peyronnet--CPN