Pular para o player
Ir para o conteúdo principal
Pesquisar
Conectar
Assistir em tela cheia
Curtir
Favorito
Compartilhar
Mais
Adicionar à playlist
Reportar
GPT‑5.2 quais são as primeiras impressões sobre o novo modelo de IA
Olhar Digital
Seguir
há 6 minutos
Categoria
🤖
Tecnologia
Transcrição
Exibir transcrição completa do vídeo
00:00
E falando em chat GPT, o nosso colunista Roberto Pena Spinelli, físico pela Universidade de São Paulo,
00:08
com especialidade em Machine Learning por Stanford, testou o novo modelo GPT 5.2.
00:16
Lembram que falamos com ele sobre isso? Pois é, ele testou. Vamos acompanhar agora as primeiras impressões.
00:24
Então, boa noite e seja muito bem-vindo, Pena.
00:27
E aí, Marisa, tudo bem? Vim aqui invadir, fora do meu dia normal, para dar notícias sobre o GPT 5.2, que sim, chegou.
00:37
A gente falou que viria essa semana e veio mesmo a pressão ali de liberar aquela coisa que a gente falou da corrida,
00:43
a UPNEI sentindo pressionada, alerta vermelho, liberou. E o que a gente viu?
00:48
Olha, as impressões iniciais são excelentes, tá?
00:53
Claro que a gente está no dia do lançamento, ainda tem que baixar um pouco esse hype,
00:58
deixar um pouco aí a galera usar um pouco mais.
01:00
Eu já usei, já testei, vou contar um pouco também do que eu testei.
01:03
Mas, aparentemente, a gente está vendo uma coisa muito boa e a UPNEI conseguiu bater de frente com os concorrentes,
01:13
que estavam vindo, principalmente com a Google, que veio a todo vapor.
01:16
Então, o que a gente pode falar sobre o GPT 5.2?
01:20
Ele está ali, ele é um dos modelos que está concorrendo ali, pau a pau com os outros,
01:24
mas se a gente olhar na questão, num dos benchmarks, num desses testes de software, o SWE,
01:31
que basicamente é de código, quem ainda está na frente é o Cloud.
01:36
O que faz sentido, porque a Anthrop, que é a fabricante do Cloud,
01:40
ela colocou todas as fichas nesse mercado, porque eles atendem principalmente empresas na questão de programação.
01:47
Só que eu vou te falar, Marisa, que o GPT 5.2 ficou ali, ó, um degrauzinho para baixo,
01:53
então, digamos que é quase um empate técnico.
01:56
Está entregando aí, basicamente, a mesma qualidade.
01:58
O Gemini ficou um pouquinho atrás nesse quesito, mas, normalmente, estão todos ali muito próximos.
02:04
Quando a gente vai olhar no outro teste, que é o Humanities Last Exam,
02:08
basicamente um teste sobre perguntas muito difíceis, sobre várias áreas de conhecimento,
02:14
quem está na frente é o Gemini.
02:16
O Gemini ali, o 3 está, o Pro está melhor,
02:20
aí a gente vê depois o 5.2, o GPT 5.2 e, por final, o Cloud.
02:27
Agora, o benchmark que realmente salta os olhos é o Arc AGI 2,
02:33
que é um sobre raciocínio abstrato.
02:36
É um desses benchmarks que você não consegue,
02:39
que exige muito um pensamento, assim, você não consegue memorizar dados.
02:43
É uma coisa mais, precisa ali de uma abstração.
02:46
E nesse, por alguns critérios, porque também tem muitos critérios como definir isso,
02:51
mas em algum dos critérios ali, o GPT 5.2 disparou ali, ficou mais em evidência.
02:57
Então, beleza, a gente está vendo aí que estão todos ali no mesmo par,
03:01
alguns um pouco para frente, para trás.
03:03
Mas o que a gente pode falar?
03:04
Taxa de alucinação, que é um dos problemas que a gente tem nos nossos LLMs, nos nossos modelos.
03:09
A UPNA reportou isso, eu não consegui testar, porque precisa de muitos testes,
03:12
mas reportou que baixou bastante comparado ao GPT 5.1 e o 5.
03:18
Então, os modelos estão ficando mais inteligentes e inventando menos coisas,
03:23
que é ótimo para a gente.
03:24
Mas então, a gente tem mais coisas interessantes,
03:26
porque a OpenAI, quando ela anunciou esse modelo,
03:30
está dizendo que qual que é a grande questão, o que ele é melhor aí,
03:35
é nas tarefas de valor, com valor econômico real.
03:39
Ou seja, tarefas de verdade que as pessoas vão fazer nos seus trabalhos,
03:43
planilha de Excel, porque muitos desses benchmarks são coisas,
03:49
pergunta do Enem, sei lá, várias coisas, coisas muito variadas.
03:55
E não necessariamente quando você chega na vida real, na prática ali,
03:58
você vai colocar ele para usar no seu trabalho, aí ele não entrega nada daquilo.
04:02
Então, a OpenAI está dizendo que para essas tarefas é o maior salto que eles deram.
04:07
Então, tem um dos benchmarks, que é o GDP Evol,
04:12
que basicamente mede isso, são tarefas meio que do dia a dia,
04:15
escolheram 14 profissões e pegam várias tarefas dessas profissões.
04:20
E esse modelo, o GPT 5.2, tecnicamente é o melhor resultado.
04:27
Só que eles não mostraram os concorrentes.
04:29
Então, eles compararam só com os modelos anteriores,
04:32
realmente tem um salto muito grande ali.
04:34
Mas a gente queria de verdade ver como é que o Gemini 3 está também performando ali.
04:40
Até porque tem um dos testes que eles colocaram, que é o teste de visão.
04:44
Colocaram lá o placa-mãe para o GPT 5.2 identificar os componentes.
04:49
Mostrou que ele está identificando muito bem já a versão anterior, 5.1.
04:53
Meio que não entendia direito ali os componentes.
04:56
Só que quando a gente vai olhar o Gemini nessa mesma tarefa,
04:59
o Gemini, ele identifica basicamente certinho cada componente.
05:04
Então, na visão, na questão visual, o Gemini ainda está na frente.
05:09
E aí eu fiz os meus próprios testes, Marisa.
05:12
Resolvi fazer meus testes.
05:14
Um dos testes que eu gosto de fazer é,
05:15
crie uma caneca 3D, assim, mostra para mim, faz aí do jeito que você quiser.
05:19
E o tanto, eu testei o Gemini 3 e o GPT 5.2.
05:26
E os dois foram bem, tá?
05:28
No primeiro prompt, os dois deram uma erradinha.
05:31
A caneca veio sem alça num, depois a alça acertou, no outro veio...
05:36
Mas os dois conseguiram atender.
05:39
Então, beleza.
05:40
Aí um outro teste que eu fiz é um teste de gerar uma simulação de um monte de bolinhas
05:45
dentro de um hexágono maluco girando.
05:47
E os dois também foram bem.
05:49
O Gemini entregou um pouco mais rápido.
05:51
O 5.2, tive que dar um segundo prompt porque ele tinha errado alguma coisa.
05:56
Enfim, não compilou.
05:57
E aí ele entregou também muito bem.
05:59
Então, do que eu posso avaliar, Marisa?
06:01
O que está todo mundo meio que...
06:03
As outras pessoas que estão fazendo é que o GPT 5.2 está entregando no mesmo nível.
06:07
Um pouquinho maior, um pouquinho menor, depende da avaliação.
06:11
Mas está lá.
06:12
A corrida segue franca.
06:14
A OpenAI, digamos, conseguiu rever esse posto
06:17
que ela tinha talvez perdido nas últimas semanas
06:20
e ela conseguiu estar ali cravando de novo.
06:23
O que a gente tem que saber é os próximos, Marisa,
06:25
porque agora a corrida se acelera.
06:28
Não sei se para bem ou para mal.
06:30
A gente está vivendo esse mundo maluco.
06:31
Mas é isso, então.
06:33
Essa foi a avaliação do GPT 5.2.
06:35
Até mais!
06:38
Tá aí!
06:39
Até mais, Pena!
06:40
Super obrigada por essa participação especial aqui hoje,
06:45
dando essa visão sobre o chat GPT 5.2.
06:50
Como você mesmo disse,
06:51
vamos aguardar os próximos capítulos dessa corrida
06:55
para ver o que acontece.
06:57
Muito obrigada e um excelente fim de semana para você, Pena!
07:00
E aí
Seja a primeira pessoa a comentar
Adicionar seu comentário
Recomendado
6:27
|
A Seguir
Senador bolsonarista e presidente da CCJ batem boca sobre PL que reduz pena por atos golpistas
Terra Brasil
há 3 horas
3:10
Previsão do Tempo: Alerta de tornados e ventos de 100km/h no Paraná
Jovem Pan News
há 11 horas
7:01
Previsão do Tempo: Vento derruba mais de 510 árvores e 2 milhões de paulistanos ficam sem energia elétrica
Jovem Pan News
há 2 dias
4:15
Homem é preso por jogar companheira do 10º andar em SP
Jovem Pan News
há 3 dias
1:24
Como Ativar Windows 11/10 Permanente Em 30 Segundos - Atualizado 2025
Oficina do PC
há 5 meses
1:52
Google anuncia navegador de IA que cria aplicativos interativos do zero
Olhar Digital
há 32 minutos
0:52
Fundador da Oracle perde bilhões e cai na lista da Forbes
Olhar Digital
há 36 minutos
0:57
Terremoto atinge nordeste do Japão e gera alerta de tsunami
Olhar Digital
há 36 minutos
1:54
Reddit entra na briga contra lei da Austrália que bloqueia jovens nas redes
Olhar Digital
há 36 minutos
2:06
Celular Seguro permitirá bloqueio de aparelhos que não têm o app instalado
Olhar Digital
há 36 minutos
1:04
Caiu aí? Bradesco e banco Next apresentam instabilidade nesta sexta-feira
Olhar Digital
há 36 minutos
45:05
Ao vivo | Descoberta desafia o que sabemos sobre Urano e Netuno | 11/12/2025 (276)
Olhar Digital
há 47 minutos
1:48
Urano e Netuno podem ser diferentes do que se acreditava
Olhar Digital
há 1 dia
1:09
Descoberta muda a história como a conhecemos
Olhar Digital
há 1 dia
1:51
Essas são as redes sociais mais presentes na rotina dos adolescentes
Olhar Digital
há 1 dia
0:54
Amazon testa novo modelo de retirada de produtos
Olhar Digital
há 1 dia
1:52
Cuidado! Hackers exploram IA para instalar malware
Olhar Digital
há 1 dia
1:30
Próteses com IA podem ser o futuro
Olhar Digital
há 1 dia
1:23
Revista Time elege Pessoas do Ano de 2025
Olhar Digital
há 1 dia
2:32
Refrigerante zero pode não ser tão saudável assim
Olhar Digital
há 1 dia
1:58
Nova terapia genética é esperança contra casos graves de leucemia
Olhar Digital
há 1 dia
1:10
Ciclone extratropical causou estragos no Centro-Sul do Brasil
Olhar Digital
há 1 dia
3:09
Ofertas de natal: Smart TV, Air fryer e fone JBL!
Olhar Digital
há 1 dia
5:15
OpenAI e Disney: o que está por trás do novo acordo?
Olhar Digital
há 1 dia
12:25
Seu Direito Digital: personagens da Disney no Sora?
Olhar Digital
há 1 dia
Seja a primeira pessoa a comentar