-
Filho da princesa herdeira da Noruega é julgado por acusações de estupro
-
Xi defende mundo multipolar 'ordenado'
-
Musk funde xAI com SpaceX em tentativa de desenvolver datacenters espaciais
-
Chefe do instituto que mede a inflação na Argentina renuncia
-
María Corina considera reunião com Delcy para definir 'cronograma de transição' na Venezuela
-
Trump insta Congresso dos EUA a acabar com 'shutdown'
-
Trabalhadores a favor e contra o governo exigem melhorias salariais na Venezuela
-
Portugal se soma a países que querem proibir redes sociais para menores de 16 anos
-
Nasa realizas testes essenciais antes de lançar missão lunar Artemis 2
-
Menino que não tinha dinheiro para passagem de ônibus participará da abertura dos Jogos de Inverno
-
Observatório astronômico europeu celebra cancelamento de projeto de hidrogênio verde no Chile
-
Kendrick Lamar: o poeta do rap consagrado no Grammy
-
Sarah Ferguson chamou Epstein de 'irmão' em e-mail ao financista
-
Agência da UE propõe limitar doses de toxinas no leite em pó
-
Bad Bunny faz história ao levar Grammy de Álbum do Ano
-
Kendrick Lamar, Bad Bunny e Lady Gaga na disputa pelo Grammy
-
Juíza rejeita pedido de Minnesota para suspender operações anti-imigração
-
Apagão deixa Kiev temporariamente sem metrô e água
-
Atividade industrial da China perde força em janeiro
-
Governo dos EUA entra em 'shutdown' mas paralisação deve ser curta
-
Documentos indicam que ex-príncipe Andrew convidou Jeffrey Epstein ao Palácio de Buckingham
-
Principal refinaria de petróleo do Equador registra segundo incêndio em oito meses
-
Dinamarquesa Maersk vai operar portos no canal do Panamá
-
Postos de gasolina têm longas filas em Cuba, que acusa Trump de 'asfixiar' sua economia
-
EUA improvisa programa de controle das finanças venezuelanas que levanta questionamentos
-
Kendrick Lamar, Bad Bunny e Lady Gaga lideram a disputa pelo Grammy
-
Desemprego no Brasil caiu para 5,6% em 2025, menor índice da série histórica
-
Reino Unido insiste em reforçar laços com a China apesar das advertências de Trump
-
Zona do euro registra crescimento de 1,5% em 2025 apesar da tensão com EUA
-
IA ajuda médicos a detectar câncer de mama em exames, aponta estudo
-
'Difícil sobreviver': idosos de Kiev tremem de frio sem luz nem aquecimento após ataques russos
-
Desemprego registra leve queda na zona do euro em dezembro
-
Premiê britânico insiste em reforçar laços com a China apesar das advertências de Trump
-
Trump ameaça com tarifas países que venderem petróleo a Cuba
-
Nubank recebe aprovação inicial para operar como banco nos EUA
-
Venezuela abre sua indústria petrolífera a investimentos privados sob pressão dos EUA
-
Trump anuncia que mandou reabrir o espaço aéreo da Venezuela
-
Colômbia restringe importação de drones diante dos ataques de guerrilheiros
-
Grupo petroquímico Dow cortará 4.500 postos de trabalho
-
Diante da pressão ocidental, Irã ameaça com 'resposta esmagadora'
-
Trump lida com consequências de ataque armado em Minneapolis, dois agentes de imigração são suspensos
-
Samsung registra lucro trimestral recorde graças à demanda por chips de IA
-
Nasa prevê lançamento de missão para troca de astronautas da ISS em 11/2
-
Lula defende soberania do Panamá sobre o Canal, questionada por Trump
-
Copom mantém taxa Selic em 15%, mas prevê 'flexibilização'
-
SpaceX quer fazer IPO em data que coincida com alinhamento planetário e aniversário de Musk
-
Trump adverte prefeito de Minneapolis sobre migração e tensão volta a escalar
-
Fed mantém taxas de juros inalteradas e desafia pressão de Trump
-
Irã adverte que 'vai responder como nunca' em caso de ataque dos EUA
-
Uma das últimas sobreviventes do Holocausto alerta para ressurgimento do antissemitismo
ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo
Os grandes modelos de linguagem (LLM, na sigla em inglês), como o ChatGPT, um dos sistemas de inteligência artificial (IA) mais populares do mundo, ainda seguem tendo dificuldades para raciocinar usando a lógica e cometem erros frequentes, de acordo com um estudo.
Estes robôs conversacionais refletem os preconceitos de gênero, éticos e morais dos humanos presentes nos textos dos quais se alimentam, recorda o estudo publicado na quarta-feira (5) na revista Open Science da Royal Society britânica.
Mas eles também refletem estes preconceitos nos testes de raciocínio?, questionou Olivia Macmillan-Scott, doutoranda do departamento de Ciências da Computação da University College de Londres (UCL).
O resultado da pesquisa é que os LLM mostram "um raciocínio muitas vezes irracional, mas de uma forma diferente da dos humanos", explica a pesquisadora à AFP.
Sob a supervisão de Mirco Musolesi, professor e diretor do Machine Intelligence Lab da UCL, Macmillan-Scott apresentou sete modelos de linguagem — duas versões do ChatGPT (3.5 e 4), da OpenAI, Bard, do Google, Claude 2, da Anthropic, e três versões de LLaMA, da Meta — a uma série de testes psicológicos desenvolvidos para humanos.
Como esta tecnologia aborda o preconceito que leva a privilegiar soluções com um maior número de elementos, em detrimento daquelas com uma proporção adequada?
Um exemplo: se tivermos uma urna com nove bolinhas brancas e uma vermelha e outra urna com 92 bolinhas brancas e 8 vermelhas, qual devemos escolher para ter a melhor chance de obter uma bolinha vermelha?
A resposta correta é a primeira urna, visto que há 10% de possibilidades frente a 8% da segunda opção.
As respostas dos modelos de linguagem foram muito inconsistentes. Alguns responderam corretamente ao mesmo teste seis em cada dez vezes. Outros apenas duas em cada dez, embora o teste não tenha mudado. "Cada vez obtemos uma resposta diferente", diz a pesquisadora.
Os LLM "podem ser bons para resolver uma equação matemática complicada, mas logo te dizem que 7 mais 3 é igual a 12", constatou.
- "Não tenho muita certeza" -
Estes modelos "não falham nestas tarefas da mesma forma que um humano", afirma o estudo. É o que Musolesi chama de "erros de máquina".
"Existe uma forma de raciocínio lógico que é potencialmente correta se a considerarmos por etapas, mas que é errada tomada como um todo", ressalta.
A máquina funciona com "uma espécie de pensamento linear", diz o professor, e cita o modelo Bard (atual Gemini), capaz de realizar corretamente as diferentes fases de uma tarefa, mas que obtém um resultado final incorreto por não ter uma visão geral.
Sobre esta questão, o professor de ciências da computação Maxime Amblard, da University of Lorraine, na França, recorda que os LLM, como todas as inteligências artificiais generativas, não funcionam como os humanos".
Os humanos são "máquinas capazes de criar significado", o que as máquinas não conseguem, explica à AFP.
Existem diferenças entre os diferentes modelos de linguagem e em geral, o GPT-4, sem ser infalível, obteve resultados melhores que os demais.
Macmillan-Scott suspeita que os modelos "fechados", cujo código operacional permanece secreto, "incorporam mecanismos em segundo plano" para responder a questões matemáticas.
De toda forma, neste momento é impensável confiar uma decisão importante a um LLM. Segundo o professor Musolesi, eles deveriam ser treinados para responder "não tenho muita certeza" quando necessário.
Y.Jeong--CPN