IAs ainda não sabem (nem entendem) o que é verdade, alerta estudo

Name: IAs ainda não sabem (nem entendem) o que é verdade, alerta estudo
Uploaded: 2025-11-05T00:26:16+00:00
Duration: 3 min 41 s
Channel: Olhar Digital
Description: Veja IAs ainda não sabem (nem entendem) o que é verdade, alerta estudo - Olhar Digital no Dailymotion

Olhar Digital

há 3 meses

Categoria

🤖

Tecnologia

Transcrição

Exibir transcrição completa do vídeo

00:00E um novo estudo colocou dúvidas sobre a capacidade das IAs de distinguir opinião de conhecimento

00:09e, portanto, de operar com segurança em áreas sensíveis, como direito, medicina e jornalismo.

00:17Vamos ver os detalhes.

00:18Modelos de inteligência artificial ainda confundem crenças pessoais com fatos objetivos.

00:30A conclusão é de um estudo publicado na revista Nature Machine Intelligence.

00:35A pesquisa analisou o desempenho de 24 sistemas, entre eles o GPT-4 Omni da OpenAI e o DeepSeq R1.

00:43Os resultados revelam uma limitação profunda.

00:47Mesmo as inteligências artificiais mais avançadas falham em reconhecer quando uma crença é falsa,

00:54especialmente quando colocada em primeira pessoa.

00:58No trabalho, os pesquisadores criaram um método de análise que reúne mais de 13 mil questões organizadas em diferentes tarefas.

01:06O objetivo foi medir até que ponto os sistemas são capazes de distinguir o que alguém acredita daquilo que é efetivamente verdade.

01:14Fronteira que, segundo os autores, continua sendo um ponto cego.

01:19Os pesquisadores, todos da Universidade de Stanford, chegaram à conclusão de que nenhuma das IAs analisadas conseguiu lidar bem com crenças falsas em primeira pessoa.

01:29Isto é, quando a frase era formulada com expressões como, por exemplo,

01:33Eu acredito que, ou eu acho que, e por aí vai.

01:39Nos testes, as IAs se saíram melhor ao avaliar crenças atribuídas a terceiros.

01:44Neste caso, alcançaram até 95% de precisão.

01:49No entanto, quando precisaram analisar crenças expressas pelo próprio narrador,

01:53A taxa caiu para 62,6%.

01:57O desempenho foi ainda mais desigual em casos extremos.

02:02O GPT-4 Omni caiu de 98,2% para 64,4%,

02:09Enquanto o DPSIC-R1 despencou de mais de 90% para apenas 14,4%, segundo o artigo.

02:18Na avaliação dos autores, o comportamento indica que os modelos não raciocinam sobre o conteúdo das declarações,

02:25Mas apenas reconhecem padrões linguísticos superficiais.

02:29Em outras palavras, ainda falta a essas máquinas uma noção real do que é acreditar e do que é saber.