-
Trump suspende operação de escolta de navios em Ormuz para impulsionar acordo com Irã
-
Musk 'ia me bater', diz cofundador da OpenAI em julgamento nos EUA
-
Três casos suspeitos de hantavírus em cruzeiro serão evacuados para Cabo Verde
-
Molière volta aos palcos graças a peça criada com IA
-
Febre K-pop: fãs aguardam ansiosos a chegada do BTS no México
-
Ex-crianças-soldado aprendem ofícios para reconstruir a vida na República Centro-Africana
-
Prêmios Pulitzer reconhecem cobertura sobre governo Trump
-
Amazon disponibiliza rede de logística para qualquer empresa
-
Cofundador da OpenAI depõe em julgamento iniciado por Musk
-
Ricos e famosos se preparam para o Met Gala, a influente data da moda
-
Britney Spears admite direção imprudente em acordo com a Justiça
-
Suprema Corte dos EUA restabelece temporariamente acesso à pílula abortiva por correio
-
Trump diz que EUA conduzirá navios para fora do Estreito de Ormuz a partir de segunda-feira
-
Adnoc, petroleira estatal dos Emirados, promete investir US$ 55 bi em 2 anos
-
Opep+ aumenta suas cotas de produção e não comenta saída dos Emirados
-
Rio entra em 'modo Shakira' antes de megashow da colombiana em Copacabana
-
Homem é detido na Áustria, acusado de envenenar comida para bebês
-
Spirit Airlines anuncia 'encerramento gradual' de operações e cancela todos os voos
-
Recusado em vários países europeus, Kanye West se apresentará na Albânia em julho
-
Armênia aposta em IA e no Ocidente com construção de megacentro de dados
-
Principal sindicato da Bolívia declara greve por tempo indeterminado contra governo
-
Trabalhadores protestam em Caracas após aumento salarial
-
Trump anuncia aumento de tarifas para carros e caminhões da UE a 25%
-
Pentágono assina acordo de IA com grandes empresas tecnológicas sem Anthropic
-
Trump anuncia aumento de 25% em tarifas sobre carros e caminhões da UE
-
Irã apresenta nova proposta para destravar as negociações de paz com os EUA
-
Acordo comercial UE-Mercosul entra em vigor nesta sexta-feira de forma provisória
-
Líder supremo do Irã desafia EUA e petróleo dispara
-
Britney Spears é acusada de dirigir sob efeito de álcool e drogas
-
Voos comerciais de EUA à Venezuela são retomados após 7 anos
-
Colômbia avalia enviar hipopótamos de Pablo Escobar à Índia a pedido de bilionário
-
Trump qualifica Charles III como 'o maior de todos os reis' ao concluir visita de Estado
-
Rio respira ar latino antes do megashow da Shakira
-
Aeroporto de Bogotá interrompe brevemente suas operações devido a um drone
-
Economia dos EUA cresce menos que o esperado e inflação dispara
-
Preços do petróleo caem após maior alta em quatro anos
-
Casa Branca se opõe a ampliar acesso da Anthropic ao modelo Mythos, diz imprensa
-
Foguete europeu Ariane 6 colocou em órbita o 2º lote de satélites da Amazon Leo
-
Irã desafia bloqueio dos EUA e preço do petróleo dispara
-
Países unem forças em Santa Marta para começar a se afastar do petróleo
-
Rei Charles III expressa 'solidariedade' com EUA no memorial de 11 de Setembro em NY
-
Alphabet dispara e seus rivais cambaleiam diante dos custos da IA
-
Trump crê que EUA vai voltar a pisar na Lua antes do fim de seu mandato
-
Suprema Corte dos EUA limita redistribuição eleitoral destinada a favorecer minorias
-
O que o futuro reserva à Opep após a saída dos Emirados Árabes Unidos?
-
Fed mantém taxas de juros inalteradas pela terceira reunião consecutiva
-
Chefe de gabinete de Milei se defende no Congresso de suspeitas de corrupção
-
Trump diz ao Irã que 'é melhor ficarem espertos logo' e aceitarem acordo nuclear
-
Guerra no Irã ameaça levar mais de 30 milhões de pessoas à pobreza
-
MBDA e Safran lançam primeiro teste de foguete de longo alcance Thundart
ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo
Os grandes modelos de linguagem (LLM, na sigla em inglês), como o ChatGPT, um dos sistemas de inteligência artificial (IA) mais populares do mundo, ainda seguem tendo dificuldades para raciocinar usando a lógica e cometem erros frequentes, de acordo com um estudo.
Estes robôs conversacionais refletem os preconceitos de gênero, éticos e morais dos humanos presentes nos textos dos quais se alimentam, recorda o estudo publicado na quarta-feira (5) na revista Open Science da Royal Society britânica.
Mas eles também refletem estes preconceitos nos testes de raciocínio?, questionou Olivia Macmillan-Scott, doutoranda do departamento de Ciências da Computação da University College de Londres (UCL).
O resultado da pesquisa é que os LLM mostram "um raciocínio muitas vezes irracional, mas de uma forma diferente da dos humanos", explica a pesquisadora à AFP.
Sob a supervisão de Mirco Musolesi, professor e diretor do Machine Intelligence Lab da UCL, Macmillan-Scott apresentou sete modelos de linguagem — duas versões do ChatGPT (3.5 e 4), da OpenAI, Bard, do Google, Claude 2, da Anthropic, e três versões de LLaMA, da Meta — a uma série de testes psicológicos desenvolvidos para humanos.
Como esta tecnologia aborda o preconceito que leva a privilegiar soluções com um maior número de elementos, em detrimento daquelas com uma proporção adequada?
Um exemplo: se tivermos uma urna com nove bolinhas brancas e uma vermelha e outra urna com 92 bolinhas brancas e 8 vermelhas, qual devemos escolher para ter a melhor chance de obter uma bolinha vermelha?
A resposta correta é a primeira urna, visto que há 10% de possibilidades frente a 8% da segunda opção.
As respostas dos modelos de linguagem foram muito inconsistentes. Alguns responderam corretamente ao mesmo teste seis em cada dez vezes. Outros apenas duas em cada dez, embora o teste não tenha mudado. "Cada vez obtemos uma resposta diferente", diz a pesquisadora.
Os LLM "podem ser bons para resolver uma equação matemática complicada, mas logo te dizem que 7 mais 3 é igual a 12", constatou.
- "Não tenho muita certeza" -
Estes modelos "não falham nestas tarefas da mesma forma que um humano", afirma o estudo. É o que Musolesi chama de "erros de máquina".
"Existe uma forma de raciocínio lógico que é potencialmente correta se a considerarmos por etapas, mas que é errada tomada como um todo", ressalta.
A máquina funciona com "uma espécie de pensamento linear", diz o professor, e cita o modelo Bard (atual Gemini), capaz de realizar corretamente as diferentes fases de uma tarefa, mas que obtém um resultado final incorreto por não ter uma visão geral.
Sobre esta questão, o professor de ciências da computação Maxime Amblard, da University of Lorraine, na França, recorda que os LLM, como todas as inteligências artificiais generativas, não funcionam como os humanos".
Os humanos são "máquinas capazes de criar significado", o que as máquinas não conseguem, explica à AFP.
Existem diferenças entre os diferentes modelos de linguagem e em geral, o GPT-4, sem ser infalível, obteve resultados melhores que os demais.
Macmillan-Scott suspeita que os modelos "fechados", cujo código operacional permanece secreto, "incorporam mecanismos em segundo plano" para responder a questões matemáticas.
De toda forma, neste momento é impensável confiar uma decisão importante a um LLM. Segundo o professor Musolesi, eles deveriam ser treinados para responder "não tenho muita certeza" quando necessário.
Y.Jeong--CPN