Pular para o playerIr para o conteúdo principal
  • há 2 meses
Transcrição
00:00E boa parte dessa dinheirama nos cofres das empresas tem a ver com a corrida da inteligência artificial.
00:07E agora, uma das expressões que está mexendo com esse setor responde pelos modelos de mundo.
00:15Você vai saber do que se trata agora com o doutor Álvaro Machado Dias em mais uma coluna Olhar do Amanhã.
00:30Então, vamos receber o doutor Álvaro Machado Dias, professor livre e docente da Universidade Federal de São Paulo,
00:45neurocientista, futurista e colunista do Olhar Digital.
00:48Deixa eu colocar o doutor Álvaro Machado aqui na nossa tela, vamos lá.
00:53Doutor Álvaro Machado Dias, muito boa noite, seja muito bem-vindo ao Olhar Digital News.
01:00Boa noite, querida Marisa.
01:02Doutor Álvaro Machado, vamos começar com o que a gente já tem.
01:07Os grandes modelos de linguagem.
01:10Depois nós temos outros assuntos para falar por aqui.
01:13Embora os modelos de linguagem sejam avançados, eles têm limitações.
01:18Por exemplo, eles podem responder de formas diferentes a mesma pergunta.
01:23E além disso, já sabemos que eles podem alucinar.
01:26Por que isso acontece, doutor Álvaro?
01:30Então, essas são grandes questões e não existem verdades totalmente estabelecidas aqui.
01:38A gente tem teses.
01:40E essas teses, elas refletem não só o conhecimento que a gente vem adquirindo sobre as IAs,
01:48como também as especulações que vão saindo nos diferentes papers.
01:51Então, às vezes, um paper sai com uma coisa que parece que faz todo sentido.
01:55Daqui a pouco vem um outro e, enfim, derruba aquele argumento com um melhor ainda, com evidências e assim por diante.
02:02No momento atual, a gente tem que separar os dois assuntos de maneira profunda.
02:08Primeira coisa é por que um modelo de IA entrega respostas diferentes em diferentes circunstâncias.
02:15Eventualmente, uma circunstância temporal de um segundo.
02:17Ou seja, eu faço uma pergunta, assim, por exemplo, me conte a história da Revolução Francesa.
02:23Aí eu faço a pergunta de novo e a segunda vez não vem idêntica à primeira.
02:26Ou eu troco de device e isso varia também e assim por diante.
02:31Olha só, o modelo de linguagem, ele vai selecionar palavras numa sequência usando probabilidades.
02:40Então, no final das contas, eu já tenho uma variação porque essas seleções probabilísticas,
02:48elas em si vão criar variedade.
02:51Por exemplo, imagina que eu tenho, eu crio a palavra A e a próxima pode ser Revolução.
02:57Eu tenho 70% para Revolução e eu tenho História, para falar a história da Revolução Francesa.
03:04E eu tenho 30% para essa palavra.
03:06Na verdade, eu tenho uma longa distribuição.
03:08Se eu jogar esse jogo 10 vezes, por assim dizer, ou 10 milhões de vezes,
03:14um terço dessas vezes vai aparecer História e 7 em 10 ou 10 milhões vai aparecer Revolução.
03:25Ou seja, existe o próprio aspecto estatístico dessas seleções faz com que as palavras variem.
03:32Só que não é só isso.
03:34Isso é o básico do básico.
03:36Tem uma outra coisa.
03:37Existe uma camada que a gente chama de camada da pseudo-randomização.
03:42O que quer dizer isso?
03:43Para além dessas seleções estatísticas, existe um elemento que de maneira proposital,
03:51olha que curioso, de maneira proposital,
03:54leva ao aumento da variedade na seleção de palavras do modelo.
03:59Mas afinal de contas, para que raios que eu vou querer aumentar essa variedade?
04:04O que é chamado tecnicamente de temperatura.
04:06A resposta é que isso torna a interação com as IAs mais interessante.
04:13Se eu tenho uma interação mais previsível, toda vez é igual, eu perguntei aquilo uma vez, parou.
04:22Agora, se eu posso receber diferentes respostas para a mesma pergunta ou eventualmente para perguntas ligeiramente distintas,
04:28eu vou ter um incentivo a mais para falar com a IA, para dialogar.
04:32Ou seja, é uma estratégia de negócios aumentar a temperatura.
04:37E existe toda uma discussão sobre qual é o grau certo de temperatura.
04:40Se eu ponho uma temperatura muito baixinha ou no limite zero, eu tenho um sistema meramente estatístico.
04:46E se eu criar algumas reduções nessa estatística, eu posso dizer que eu vou ter um sistema quase determinístico.
04:53Em outras palavras, eu vou perguntar uma coisa e ele vai dar sempre o mesmo resultado.
04:56Por exemplo, eu digo que ele sempre tem que escolher a palavra que tem maior probabilidade, toda vez.
05:01E aí ele vai responder toda vez a mesma coisa.
05:03Só que as respostas vão ser pobres e a minha experiência como usuário vai ser repetitiva.
05:08Do outro lado, se eu aumento dramaticamente a temperatura, ele vai falar coisas exuberantes, variadas e etc e tal,
05:15mas a capacidade de ir direto ao ponto vai estar diminuída.
05:20Esse é o trade-off aqui, Marisa.
05:21Do outro lado, por que as alucinações acontecem?
05:23É uma nova discussão que cada dia muda um pouquinho.
05:26Mas o entendimento hegemônico é que é mais um reflexo de escolhas de negócios.
05:34Ou seja, certo sentido é por querer.
05:37E qual que é esse sentido?
05:39Olha só, na medida em que eu aumento a temperatura,
05:44ou seja, eu crio maior variabilidade de linguagem,
05:48eu crio enriquecimentos.
05:50Esses enriquecimentos também fazem com que a IA generativa se afaste das suas certezas,
06:00daquilo que ela sabe.
06:01Está lá no conjunto de treinamento uma coisa objetiva.
06:03Tem uma explicaçãozinha que ela tirou de um livro de história contando sobre a Revolução Francesa.
06:08Se eu vou encher de palavras ali no meio, de variações naquela história,
06:13eu tenho mais chance de me afastar desse registro originário.
06:17No final das contas, é a deliberação para não afirmar uma incerteza,
06:24não dizer eu não sei, não me ater, como o IA,
06:28ao estritamente conhecido que faz com que as alucinações venham à tona.
06:33Porque senão, você ia perguntar alguma coisa para a IA,
06:35ou ela ia te dar uma resposta simples e direta,
06:39ou ela eventualmente ia dizer não sei.
06:41E aí você poderia ficar bastante desinteressada em usar essa IA,
06:44que afinal de contas não sabe alguma coisa.
06:46Então, tal como existe esse doom scrolling,
06:48essa scrollagem infinita nos aplicativos,
06:52todos eles têm hoje em dia,
06:53e aquilo eventualmente vai te dando uma sensação de angústia,
06:57mas ao mesmo tempo de que não tem fim
06:59a quantidade de estímulos naquela interface,
07:02aqui é a mesma coisa.
07:04Você tem sempre uma resposta na ponta da língua digital da IA,
07:08o que vai te dando essa sensação ao mesmo tempo angustiante,
07:10mas de que ela é uma fonte infinita de saber.
07:13Eventualmente, mesmo não sendo verdade,
07:15afinal de contas, a incerteza é tão grande
07:17que ela vai injetando ideias que não fazem sentido,
07:19não correspondem à realidade, ou em outras palavras, alucinações.
07:24Interessantíssimo.
07:24Aliás, excelente explicação, como sempre, doutor Álvaro.
07:27Fica muito mais claro para a gente acompanhar essas possibilidades.
07:31Agora, o próximo passo está nos chamados modelos de mundo.
07:37Vamos lá, explica para a gente qual é a diferença para essa tecnologia
07:41e o que ela tenta resolver.
07:44Novamente, essa é uma discussão em aberto,
07:50tem gente que não concorda em nada.
07:52Inclusive, se você pegar, por exemplo,
07:54grandes expoentes como o Sun Altman,
07:56o Dario Amodei, da Antropic,
07:58vão dizer que, não, com LLM a gente vai chegar
08:01na inteligência artificial geral e, eventualmente,
08:03na superinteligência.
08:04Não parece ser verdade.
08:06E aí vem a grande questão.
08:08Olha só, o ser humano nasce e, pouco tempo depois,
08:14intui de maneira absolutamente espontânea,
08:19inclusive é muito bonito ver isso,
08:20quem tem ou já teve filho pequeno sabe bem,
08:23intui aspectos de como o mundo funciona.
08:27Por exemplo, por que a criança ri
08:29quando você se esconde atrás da almofada e tira a almofada?
08:31Porque ela está desenvolvendo um senso
08:35de constância de objetos.
08:37E ela ri, não porque ela acha aquilo um absurdo,
08:40ela ri porque ela fala
08:40ah, ah, ah, ah, eu sabia que você estava atrás da almofada.
08:44Ela está desenvolvendo isso,
08:46ela está maravilhada com o seu próprio senso
08:49de constância de objeto, como dizia Vygotsky,
08:52que foi um dos grandes intelectuais
08:53desse tipo de formação cognitiva humana.
08:58Então, na prática, a gente está falando
09:01que a criança está adquirindo princípios
09:02newtonianos, por assim dizer, tá?
09:05O mundo funciona de maneira quântica
09:07e à luz da teoria da relatividade
09:09e, eventualmente, de uma conjunção das duas coisas
09:11que ninguém ainda conseguiu formalizar.
09:14Mas, na prática, aqui no planeta Terra,
09:16as coisas funcionam de maneira bastante newtoniana.
09:18Eu jogo a bola para cima
09:19e eu olho para cima
09:20e eu faço assim com a cabeça espontaneamente,
09:21porque eu sei que ela vai cair.
09:23E assim por diante. Por quê?
09:24Porque eu sei que as coisas no planeta Terra
09:26que sobem, elas descem.
09:27Eu sei que o objeto não desaparece do nada,
09:30como a questão da almofada mostra.
09:32E assim por diante.
09:33Eu sei que se eu empurrar uma coisa
09:34sobre uma pista
09:35e a pista for bem lisinha,
09:37ela vai deslizar mais
09:37do que se eu empurrar a coisa sobre areia.
09:40Então, eu já sei que eu modulo
09:42a força que eu ponho na mão
09:43e tudo mais.
09:44É um conhecimento do mundo.
09:47Mas não é do mundo
09:48no sentido que eu tenho que ir lá
09:49explorar o planeta Terra
09:51e conhecer todas as realidades do mundo.
09:54Não.
09:54É de como o mundo funciona.
09:55No caso, eu descrevi propriedades newtonianas.
09:58Mas existem outras propriedades
10:00que são sobre como o mundo funciona.
10:02Por exemplo, no mundo,
10:04eu falo uma coisa para outra pessoa
10:05e eu espero que essa pessoa
10:07entenda o que eu falei.
10:09São coisas assim.
10:10Quando duas pessoas estão conversando,
10:12se eu falei uma coisa
10:13e a outra ficou quieta um segundo,
10:14eu espero que ela responda para mim.
10:17São códigos meramente sociais,
10:18mas eles estão no mundo,
10:19porque eles valem em todas as sociedades.
10:21sejam elas industriais, urbanas ou não.
10:26E assim vai.
10:27O que acontece?
10:28Aí a generativa,
10:30como ela aprende a partir
10:30de um corpus linguístico
10:32e de imagens e vídeos hoje em dia,
10:35ela não forma,
10:37ela não tem princípios de base
10:39sobre as realidades primárias
10:42que definem a relação com o mundo.
10:45Tipo a constância de objeto
10:46que um bebê de quatro meses,
10:48três, quatro meses,
10:49começa a ter.
10:50Ela não tem isso.
10:52E, consequentemente,
10:54ela comete erros
10:56que são de difícil manipulação,
10:59de difícil resolução.
11:01Então, exemplo,
11:02o Sora 2 é um salto
11:04em termos de produção de vídeo
11:06em relação ao anterior.
11:08E o VIOA 3 é magnífico
11:10e assim por diante.
11:11A gente tem várias IAs de vídeo
11:14incríveis.
11:16Mas, por que os vídeos
11:17são tão curtinhos?
11:18Por que na prática
11:19todo mundo fala que Hollywood,
11:21tem essa fala poderosa,
11:22Hollywood vai ficar de joelhos
11:24em relação,
11:26frente ao vídeo feito por IA.
11:28E o que eu estou vendo
11:29são os cineastas
11:30totalmente imersos
11:32na produção
11:32dos filmes do ano que vem.
11:35Por quê?
11:36Porque a realidade é que
11:37quando você começa a aumentar
11:38esse tempo de processamento,
11:40você aumenta as chances
11:41da IA fazer alguma coisa
11:43que, do ponto de vista
11:44newtoniano,
11:44não faz sentido.
11:45Então, você põe água no copo
11:47e, em vez da água transbordar
11:48no copo, ela sobe
11:48e se sustenta no ar,
11:50coisa que seria impossível.
11:52Ou a roda da bicicleta
11:53roda de um jeito
11:54levemente esquisito
11:56que intuitivamente faz a gente
11:57identificar que tem algo
11:59de errado ali
11:59porque ela não está
12:00seguindo as leis da física.
12:02Uma pessoa fala
12:03e a outra responde
12:04de uma maneira
12:04que está desincronizada
12:06em relação ao código social
12:08vigente no planeta Terra
12:09como um todo
12:10e assim por diante.
12:11World models
12:12ou modelos de mundo
12:13são a implementação
12:15dessas regras fundamentais
12:17que regem as interações
12:18com a realidade física
12:19e intersubjetiva.
12:21Isso representaria
12:22um salto gigantesco
12:24e uma aproximação
12:25com a realidade observada
12:26pragmática dos humanos
12:27e, consequentemente,
12:29a isso abriria portas
12:30para IA muito mais capazes
12:32tanto na produção audiovisual
12:33quanto robótica
12:34e tudo mais.
12:35Afinal de contas,
12:36a gente precisa interagir
12:37com alguém que entende
12:37o mundo como a gente
12:38para as coisas darem certo.
12:39Interessantíssimo.
12:42Agora, doutor Álvaro,
12:43e quais são os desafios
12:44para se chegar até lá?
12:46Ou seja,
12:47é hardware,
12:48é software,
12:48é um pouco de tudo?
12:50Como que isso vai funcionar?
12:52Três desafios.
12:53Hardware, software
12:54e um pouco de tudo.
12:57Brincadeira,
12:57mas olha só,
12:58é hardware, claro,
13:00porque isso aí
13:00existe muito mais processamento,
13:02mas hardware na prática
13:04quer dizer custo, tá bom?
13:05Não quer dizer que falta
13:06um hardware capaz de fazer isso.
13:07Não, custa mais.
13:09Então, esse problema existe,
13:10mas não é ele
13:11que está limitando a gente agora.
13:13Software é um problema?
13:15É um problema,
13:16mas nem tanto.
13:17Não é a questão,
13:18por exemplo,
13:20na Meta,
13:21você tem todo um desenvolvimento
13:23do JEPA,
13:24que é um modelo de mundo,
13:26que tem software e tal,
13:28mas o que está faltando
13:30de maneira mais fundamental
13:32é um modelo conceitual mesmo,
13:35teórico.
13:36Então, é engraçado,
13:36porque em geral é assim,
13:37não, o cientista não importa
13:39nessa história.
13:40É, mas o que está faltando
13:41é o trabalho do cientista,
13:43entendeu?
13:43Como sempre,
13:44falta esse mega insight
13:45que permita o salto.
13:47Ele está acontecendo aos poucos.
13:49Então, no JEPA, por exemplo,
13:52existe uma nova maneira
13:56de lidar com redes neurais,
13:59nova, ela não é nova,
14:00mas ela é diferente
14:02das redes neurais do tipo
14:03Transformer,
14:04que são as redes neurais
14:05da IA generativa lá,
14:07Chart-EPT e Gemini,
14:10e que ela tem componentes
14:12chamados simbólicos.
14:14Então, ou seja,
14:15ela tem um tipo de processamento,
14:17simbólico quer dizer que é igual
14:18linha de comando do computador
14:19de antigamente,
14:20ela tem regrinhas.
14:21Então, são coisas assim,
14:23as regrinhas orientam
14:25os modelos de mundo.
14:26Não é que as regrinhas
14:27ficam lá o tempo todo,
14:28mas essas IAs,
14:30elas são treinadas
14:31de uma maneira diferente.
14:34E isso daí está evoluindo muito,
14:35porque não basta dizer,
14:36é fácil dizer que essas IAs
14:38de hoje em dia
14:38são insuficientes
14:39e não são muito boas,
14:41o que é óbvio,
14:42e ficar quieto depois.
14:43A questão é,
14:44como é que faz?
14:46E ninguém sabe.
14:46Realmente é um campo
14:47científico em aberto
14:49e as maiores,
14:50algumas das maiores mentes
14:51do planeta Terra
14:52estão imersas nesse assunto.
14:55Agora, por que eu brinquei
14:56que é software, hardware
14:57e as duas coisas ao mesmo tempo?
14:58Porque, no fundo,
14:59quando a gente fala
15:00das duas coisas ao mesmo tempo,
15:00é o seguinte,
15:02uma verdade
15:03que os críticos
15:04do paradigma atual
15:06vêm colocando
15:07é que o excesso
15:09de investimento
15:10e de importância
15:11da IA generativa
15:13tal como ela é hoje em dia
15:14dificulta o investimento,
15:17desincentiva
15:18o investimento
15:19nessas outras alternativas
15:20que têm mais chance
15:22de prosperar lá na frente.
15:24Por quê?
15:25Porque elas não têm
15:25nenhuma chance
15:26de prosperar agora.
15:27Isso é um negócio
15:27que muita gente acha
15:28que a gente está
15:29muito próximos da AGI,
15:31mas não,
15:32a gente está muito longe,
15:33razoavelmente longe.
15:34Não, não está muito longe.
15:36Razoavelmente longe,
15:37sei lá,
15:37uma década talvez.
15:38E aí,
15:39não há tanto incentivo
15:40para investir
15:41em tanta ciência básica.
15:42Esse é o problema.
15:44Então, na realidade,
15:46esse não é um caminho
15:47somente
15:48para a inteligência artificial
15:49geral.
15:50Ela é um avanço,
15:52digamos assim,
15:53independente.
15:53é isso, doutor Álvaro?
15:56Sim,
15:57exatamente.
15:58Ela é um caminho
15:59totalmente independente.
16:01Ela é uma via
16:03para a gente aproximar
16:05a forma como
16:06IAs,
16:07sejam elas
16:08embedadas
16:09em servidores,
16:11sejam elas
16:12embedadas em robôs,
16:14funcionam.
16:15E, acima de tudo,
16:17ela é uma maneira
16:18de transferir
16:19o conhecimento
16:19que vem das neurociências,
16:21da psicologia
16:22cognitiva
16:24e assim por diante
16:24para esse universo
16:26das máquinas,
16:27criando um negócio
16:28que eu defini lá atrás,
16:29que é essa nova
16:31disciplina
16:34que é a psicologia
16:35das máquinas.
16:35interessantíssimo.
16:38Bom, o tema
16:39hoje realmente
16:40muito interessante
16:41e todas as explicações
16:43excelentes.
16:44Doutor Álvaro
16:45Machado Dias,
16:46teremos mais assuntos
16:47na próxima semana.
16:49Eu agradeço muito
16:50por hoje
16:50e tenha uma excelente semana.
16:52Boa noite.
16:54Eu que agradeço.
16:55Boa noite para você
16:55e para todo mundo
16:56que nos acompanhou.
16:57Até quarta que vem.
16:58Até, doutor Álvaro.
17:00Está aí, pessoal,
17:00doutor Álvaro
17:01Machado Dias.
17:02Espero que vocês
17:03tenham gostado.
17:04Eu adorei o quadro
17:05aqui hoje
17:06com temas
17:06interessantíssimos
17:08e com explicações
17:09que nos ajudam
17:10ali a situar melhor
17:12nesse mundo
17:13dos agentes
17:14de inteligência artificial.
17:16O doutor Álvaro
17:16Machado Dias
17:17é professor livre docente
17:18da Universidade Federal
17:20de São Paulo,
17:21neurocientista,
17:22futurista
17:23e nosso colunista.
17:25Semana que vem
17:25temos mais.
Seja a primeira pessoa a comentar
Adicionar seu comentário

Recomendado