- há 9 minutos
Categoria
🤖
TecnologiaTranscrição
00:00Vamos repercutir esse assunto agora, na nossa coluna Falae.
00:11E vamos receber Roberto Pena Spinelli, que é físico pela USP, especialista em Machine Learning por Stanford
00:20e colunista do Olhar Digital. Vamos lá? Deixa eu encontrar com o Pena aqui na nossa tela.
00:28Olá, Pena. Muito boa noite, querido. Seja muito bem-vindo.
00:33Tudo bem, Marisa? Boa noite. Boa noite para você, para todo mundo estar em casa.
00:37E aí, o que a gente vai falar hoje, Marisa?
00:40Ah, pois é. Como sempre, muitas novidades, muitas coisas atuais.
00:44Mas vamos começar por essa conclusão de que o uso exagerado da IA pode provocar um cansaço mental
00:52e traz uma importante pergunta, aliás, né, Pena?
00:55Estamos ganhando produtividade ou apenas elevando as nossas expectativas?
01:01É, Marisa, esse é um dos novos paradigmas ou paradoxos que a gente vai ter que enfrentar
01:07nesse mundo com o IA.
01:09Então, vamos entender.
01:10IA realmente pode entregar produtividade? Sim.
01:14Então, quando a gente vê tarefas repetitivas que você consegue, que a IA vai lá e consegue
01:22fazer para você rapidinho. Quando você tem essa capacidade de você ter um especialista
01:28no seu bolso, certo? Você, antes que às vezes você tem que descobrir um negócio,
01:33para gastar horas, às vezes pesquisando, não sei o que. Cara, deixa aí, roda a IA a fazer
01:37uma pesquisa profunda. Ela vai conseguir te trazer um monte de coisa.
01:42A gente tem código, que é uma das tarefas que ela vai melhor. Nossa, quanto tempo que
01:47eu consigo, de fato, economizar em código. Então, assim, existem diversos textos para
01:52você resumir, às vezes, uma coisa. A gente consegue ver. Não é que é falso, não é
01:57que a premissa é falsa. Só que o que acontece, Marisa? Agora o ser humano começa, se você já
02:04tem um monte de tarefas que eram repetitivas, que você consegue ganhar tempo, ou que eram
02:08essas tarefas que levavam, que você, naturalmente, para fazer elas, você tem que, você vai gastar
02:14um dia ali para fazer. A sua carga mental já está domada por essas tarefas que a gente
02:19costuma fazer. A gente não está com uma supercarga cognitiva. No momento que eu estou
02:24lá fazendo uma pesquisa, não estou o tempo todo lendo. Não, eu estou lá, entro num site,
02:28dou uma observada, vou no outro. Vou ler um texto, vou ler o texto. Depois eu vou pensar,
02:33vou analisar. Existe uma dinâmica que a gente já está acostumado de equilíbrio de
02:38tarefa mental com tarefa manual, com trabalhos de escritório ou outros trabalhos. Quando
02:44a IA vai ganhando e comendo, digamos, toda essa parte dessas coisas mais repetitivas e
02:50vai te entregando só o próximo passo, que é uma demanda mental que você tem que fazer
02:54uma próxima decisão, pegar o resumo dali, ver como que isso encaixa, isso muda a dinâmica,
03:00o equilíbrio que a gente está acostumado. Só que agora vem o problema. Porque se de
03:06repente a IA pudesse fazer essas tarefas e a gente diminuísse a nossa carga de trabalho,
03:11digamos que no final do dia você vai entregar o mesmo relatório. Digamos que você vai gastar
03:16um dia para fazer um relatório lá do fim do mês. Então você tirou o dia para fazer
03:21aquele relatório. Agora com a IA te ajudando a resumir, fazendo pesquisa, compilando dados,
03:26você gastou meio dia, talvez um terço do seu dia para fazer o relatório. Você poderia sair
03:31mais cedo nesse dia. Você poderia, em princípio, tá bom, fiz a tarefa do dia, era isso que era
03:36esperado. Só que agora a sua referência, já que as pessoas agora, você quer produtividade,
03:42então ao invés de você aliviar o trabalho da pessoa, não. Você vai fazer três relatórios.
03:45Por que se você termina um e um terço do dia? Só que o que as pessoas não fazem a
03:49conta,
03:50os empregadores, as empresas, é que a tarefa de fazer três relatórios no mesmo dia não é
03:56a mesma, em termos de carga cognitiva, do que você gastar um dia inteiro para fazer
04:00um relatório. E as pessoas estão começando a ser esmagadas, fritadas, né? Esse é o
04:05termo que ele usa ali, esse cérebro frito, porque a gente está com um processador que
04:10antes era aliviado para fazer várias outras coisas, se dilui, agora ele está tentando,
04:15o gargalo se tornou o ser humano, a cognição humana nesse mundo e as pessoas estão.
04:20Então, é extremo cuidado que a gente tem que ter agora. A gente não pode só aplicar uma
04:24lógica linear, proporcional. Se você faz, leva um terço aqui, você multiplica por
04:31três, porque o ser humano não foi ainda dosado. A gente não tem essa capacidade.
04:35Ou a gente descobre, isso vai levar tempo, anos, te acostumar, gerações e tal, ou a
04:41gente precisa mudar. A gente não pode só escalar isso de maneira, porque vai sim
04:46fritar o cérebro das pessoas, como o estudo está mostrando.
04:48Pois é, isso até só o começo, né? Porque a gente está começando a integrar já a IA no
04:55dia a dia com mais frequência por agora, mas ainda é um começo, né? Imagina isso daqui
05:00um tempo. Pena, agora vamos falar sobre uma novidade. Nos últimos dias, o Google revelou
05:07o TurboQuant, que é uma tecnologia que permite que modelos de IA lembrem de muito mais dados
05:15ao mesmo tempo, em que ocupam menos espaço físico na memória do hardware. Ele explica
05:22para a gente o que isso significa na prática, Pena.
05:25Nossa, isso aí foi bem surpreendente. Como eu gosto de explicar as coisas para vocês, eu
05:32vou tentar aqui, né? Assim, para não ficar só nesse raso. Mas como que funcionam essas
05:38IAs, a gente tem duas coisas para elas funcionarem. Uma são os neurônios, de fato. São as conexões
05:44neuronais, tá? Você precisa ter memória para guardar como que os neurônios se comunicam,
05:50como que eles... exatamente como o cérebro do neurônio está definido, da IA está definida.
05:57Isso aí não tem o que fazer. Quer dizer, tem algum jeito de se melhorar, mas você... ok,
06:01isso aí você precisa de uma memória razoável para isso. A outra quantidade de memória que
06:05você precisa é para pegar o contexto. Imagina que você está escrevendo, então aquilo vai
06:11virando palavras. Essas palavras, de fato, vão virar tokens, que são representações
06:18num espaço... é como se fosse na cabeça da IA. Isso vai virando pontos, tá? Vetores.
06:23São pontos num espaço abstrato. Assim como a gente, quando a gente pensa em alguma coisa,
06:28de algum jeito na nossa cabeça, a gente vai... tem gente que pensa com imagens, tem gente
06:34que pensa com uma voz que fala, mas não importa o jeito que você pensa. Você, no momento
06:39que pensa, algo na sua cabeça acontece que você vai organizando essas entidades lá
06:43dentro. Na inteligência artificial é parecido. Existem esses objetos que você vai conversando
06:49vão virando... imagina que vira uma caneca, vira um pinguim, ó, até tem aqui aqui, e eles
06:55são posicionados em alguns lugares, tá? E o que que importa no final das contas, para
07:00IA poder entender o contexto, é a relação entre essas coisas. Então, se esse pinguim está
07:05mais distante ou menos distante dessa caneca, e essas relações, né, ou seja, como que
07:11essas palavras que viram essas abstrações se distribuem nesse espaço, e como é que
07:18o modelo vê de uma, sai de uma palavra e vai para outra, essas relações é que dão
07:23significado para as palavras que ele faz entender o contexto, tá? Então, normalmente,
07:27ele vai escrevendo o texto, e essas palavras todas vão populando essa memória dele, que
07:32é esse espaço que a gente chama de espaço latente, tá? Se alguém quiser um nome bonito
07:35é espaço latente. E aí ele vai trabalhando, só que você vai enchendo a memória do modelo,
07:41você vai usando o contexto, daqui a pouco ele está com um milhão de palavras ali voando
07:45e tentando entender a relação das palavras, isso gasta memória. O que a Google conseguiu
07:49fazer com esse TurboQuant é um jeito de você representar essas canecas, esses pinguins
07:54lá dentro, de um jeito muito, muito, muito, gastando muito menos memória. E como que você faz isso?
08:00É você, em vez de representar o pinguim perfeitinho, onde ele está exatamente, detalhe
08:05do pinguim, não. Joga um pinguim genericão ali, mais ou menos aqui. Você vai perder
08:10informação, não tem segredo. Para você diminuir a memória, alguma informação você
08:14perde. Mas o que eles estão argumentando é que a posição exata do pinguim e a cor do
08:21olho do pinguim, o bico do pinguim, é irrelevante para você entender cognição ou para entender
08:26semântica. O que importa é a relação entre a caneca e o pinguim. Se o pinguim está mais
08:32para cá e a caneca também está mais para cá, a relação é a mesma. Ou seja, eles
08:38perceberam que você pode comprimir dados, diminuir a quantidade de definição que você
08:43tem, desde que você mantenha a relação das coisas iguais. E quando eles fizeram isso,
08:48Marisa, eles conseguiram seis vezes compactação, uma computação de seis vezes. É um número
08:53muito grande. Quando a gente está falando de teoria de compactação, isso é um número
08:57extraordinário. Isso chama muita atenção. Quer dizer que agora, se a gente aplicar essas
09:00técnicas, que foi anunciado na semana passada, no final da semana passada, então a gente
09:06poderia ganhar muito, enxugar muito a memória necessária para fazer processamento de janelas
09:12de contexto. Chegou uma hora que está usando o modelo muito, chegou uma hora que esgota os
09:16tokens ali, ele pede água. Não consigo mais, acabou. Não tenho mais onde pôr pinguim.
09:22Acabou os pinguim. Agora a gente vai poder pôr mais pinguim.
09:27Muito interessante, Pena. Deu para a gente entender bastante bem essa relação do que
09:32foi colocado um pouquinho de lado, que são esses detalhes, para justamente aliviar o
09:38processamento. Muito bom, parabéns. Gostei. Entendemos bastante bem o que o Google
09:42quis fazer. Quis fazer, não, conseguiu fazer, não é, com essa diminuição. Agora, Pena, eu
09:48queria aproveitar a sua presença aqui hoje para falar sobre um assunto que aconteceu
09:51ontem por aqui, ou essa semana, no Olhar Digital News, falando sobre um novo estudo que alerta
09:57para o comportamento das inteligências artificiais meio bajulador. É como se ela não quisesse
10:04discordar do usuário, então ela sempre concorda, ainda que haja, ou que hajam erros, né, nas
10:12atitudes e nas falas dos usuários. A pergunta é, isso é um problema técnico da IA ou não?
10:18Ou é apenas um aprendizado, um modelo, né, um modelo de aprendizado que vem sendo feito?
10:26Eu acho que a resposta é ambos, Marisa.
10:31De onde vem esse problema? Por que que as IAs que a gente faz hoje ficam bajulando você?
10:36A resposta crua é porque a gente gosta. É porque, no final das contas, o que o ser humano
10:41gosta de verdade é ser concordado.
10:45Isso está nas nossas relações sociais. Se você vai elogiar alguém, perfeito, pode elogiar.
10:50Elogia, vontade. Então você vai criticar? Qual é o esforço que você tem que fazer
10:55para poder criticar, para a pessoa não sentir mal, para ela não achar que...
10:58A gente vive numa sociedade bajuladora. E a gente gosta, porque faz bem.
11:04Como nós somos animais sociais, a gente aprendeu, a gente foi selecionado não para necessariamente
11:11lidar com a verdade e tal, mas para lidar com pessoas, para poder justamente lidar nesse
11:17ambiente e elogiar e bajular é uma estratégia vencedora nesse contexto.
11:22Então nós somos treinados primeiro para sermos bajulados.
11:24Mas é claro que ninguém quer ser bajulado a mais da conta, porque a gente também não
11:28quer perder a noção da realidade.
11:32Existe um ideal.
11:34Quer dizer, eu acho que... Eu sou uma pessoa que costumo ser muito direta, muito crítica
11:40e sou mal interpretado.
11:41Costumo ser, porque eu falo muito na real.
11:44Eu não gosto da gente cagar... Ah, eu tenho que fazer três mil...
11:46Não, eu não estou pegando nada pessoal.
11:48Mas olha, eu achei que esse trabalho não ficou legal.
11:50É só isso.
11:51Não ficou legal.
11:51Não estou dizendo que isso é feio.
11:53Eu só estou dizendo que não ficou legal.
11:55Mas a gente...
11:56Então eu sou uma pessoa esquisita.
11:58Mas enfim.
11:58Então o que a gente faz?
11:59Quando a gente vai treinar essas IAs, a gente tem uma etapa de chamada pós-treinamento,
12:03que é onde a gente vai refinar o modelo.
12:06O modelo já aprendeu a escrever, já aprendeu a pensar, já sabe um monte de coisa.
12:09Mas ele escreve de um jeito meio duro, meio ríspido.
12:13Não sabe dizer como...
12:14Ele não responde direito.
12:16Ele não parece uma pessoa funcional.
12:17A gente precisa transformar agora esse modelo em uma pessoa funcional, que vai falar direito
12:21com você, vai fazer frase que faz sentido.
12:23E aí a gente faz o pós-treinamento.
12:24Esse pós-treinamento tem vários jeitos de você fazer.
12:26E um deles que a gente acaba usando é um treinamento de reforço, com feedback humano.
12:33Então basicamente você coloca um ser humano ali, ele recebe duas respostas, e ele vai
12:37dizer qual resposta ele gostou mais.
12:40Olha, então o mesmo modelo responde duas vezes.
12:43E aí ele fala assim, ah, essa aqui parece mais legal.
12:45E vota.
12:46E a gente, né, o humano vai votando na resposta preferida.
12:49Hoje em dia já não usa mais o humano pra isso.
12:51Usam outros modelos de A que simulam isso.
12:54Mas não deixa de ser a mesma coisa.
12:55Você vai dando pontos toda vez que a resposta foi boa.
12:58Mas Marisa, a gente vai dando joinha nas mensagens que se parecem mais confiantes,
13:05ou aquelas que te agradam mais.
13:07Então é natural que a gente vai selecionando sozinho o comportamento bajulador.
13:13Porque a hora que você tá lá analisando, você não tem certeza se o que ele tá falando
13:17é mentira ou não.
13:18A gente nem sabe às vezes a informação, se é verdadeira ou falsa.
13:21Mas a gente sabe que, olha, ele pareceu confiante.
13:23Nossa, como fala bem, né?
13:24Nossa, ele disse que eu sou genial.
13:27Eu gostei que eu pareça genial.
13:28E a gente vai só afirmando os nossos vieses, os nossos preconceitos,
13:34o que a gente acredita que é certo.
13:36A gente achando que tá abalando, que o modelo tá ótimo, tá super bem treinado.
13:39Mas não, ele aprendeu a concordar com você.
13:41Então esse é um problema muito difícil.
13:44Agora as empresas estão tentando resolver isso de outras maneiras,
13:46mas não é um problema fácil de resolver.
13:48Porque é o que a gente chama de problema do alinhamento.
13:51Como garantir, como fazer a IATA um comportamento que seja o ideal pra gente?
13:55Que ela não bajule demais, mas também não seja super crítica.
13:58Às vezes, não é isso.
13:59Se ela for super durona,
14:01pô, uma pessoa que tá ali, de repente, vai se sentir desestimulada.
14:05Ah, eu quero fazer matemática.
14:06Não, não faz matemática.
14:07Isso não é pra você.
14:08Você, seu QI é baixíssimo.
14:10Não tem como fazer.
14:10Imagina se a gente recebe uma resposta dessa.
14:12Não, também não é bom.
14:13Porque, assim, o ideal é você entender.
14:16E isso é muito difícil, Marisa.
14:18E quando você tenta ajustar um parâmetro,
14:20aquele parâmetro automaticamente se torna explorado.
14:23E a IATA leva ao limite qualquer coisa que a gente tenta otimizar.
14:28Ela se torna um excelente otimizador.
14:30E isso sempre leva pra resultados ruins.
14:33Então, no final, respondendo a sua pergunta,
14:35por mais que seja um problema técnico,
14:36e também é um problema social,
14:38porque a origem vem no final do que a gente acha bom.
14:42Veja que quantos coaches existem por aí hoje na internet ganhando dinheiro
14:47porque falam bem, acham,
14:49ah, falam um monte de coisa que não faz ideia,
14:50nunca aprendeu nada, mas fala que ele...
14:53Você ouve o cara falando e diz,
14:55nossa, isso aí, isso aí, pode,
14:56ah, vou comprar o seu curso.
14:58Quantos cursos a gente não compra
14:59de pessoas que só estão te enganando?
15:02No final das contas, a IATA se tornou excelente
15:04pra se passar por isso.
15:06Claro, tô generalizando,
15:07o estudo tá mostrando que tem esse comportamento,
15:09mas não que ela sempre faça isso.
15:11Mas a gente tem que se tornar muito, muito, muito mais crítico agora, Marisa,
15:15quando estiver usando a IATA,
15:17porque a gente pode virar, cair na sua própria armadilha.
15:19Então, eu sempre tento fazer os meus prompts
15:23não já dando a resposta
15:25ou aquilo que eu acho que eu vou gostar.
15:27Eu tento sempre pôr a pergunta
15:29do jeito mais neutro possível
15:30pra que a IATA não tenha pista do que eu quero.
15:33Eu não vou dizer assim,
15:34olha, esse estudo é super legal, né?
15:36Ele disse isso, isso, isso.
15:37Não, eu acabei de dizer que o estudo é legal.
15:39Então, se a IATA vai querer concordar
15:41porque ela sabe que eu achei o estudo legal.
15:43Então, eu vou dizer assim,
15:44o que você acha criticamente desse estudo?
15:46Seja rigoroso.
15:47Pronto, eu não disse se eu gostei,
15:48se eu não gostei, faz a sua análise aí
15:50e aí eu vou tentar o mínimo possível
15:53me passar as minhas preferências pra IATA
15:55pra que ela não tenha jeito de querer me bajular.
15:58Então, no final das contas,
15:59esse é um comportamento que eu recomendo.
16:01Seja crítico primeiro e fala
16:02IATA pode me bajular
16:03como eu faço pra ela não ser bajuladora.
16:06Enfim, é uma dica que eu dou,
16:08mas não é um problema fácil.
16:09Tá longe de ser resolvido, Marisa.
16:11Ah, como o próprio relacionamento humano, não é, Pena?
16:13Essa questão de saber lidar com as pessoas também
16:16eu acho que é uma grande dificuldade do ser humano, não é?
16:20Agradar por agradar, discordar por discordar, enfim.
16:24É isso.
16:24A IATA aí seguindo os passos da humanidade.
16:27Vamos ver aonde a gente chega.
16:29Tá certo.
16:30Tá aí mais um.
16:31Fala aí com Roberto Pena Spinelli.
16:33Super bacana, viu, Pena?
16:35Semana que vem teremos muito mais assuntos
16:37pra tratar por aqui.
16:38Excelente semana pra você, viu?
16:40Obrigado, Marisa.
16:41Foi muito legal.
16:43Dessa vez foi um pouco mais leve.
16:44A gente não falou de coisas muito pesadas.
16:47Então, vamos ver.
16:48Até semana que vem.
16:49Semana que vem tem mais.
16:52Um abraço.
16:53Outro, querido.
16:53Beijão.
16:54Boa semana.
16:55Tá aí Roberto Pena Spinelli com a gente
16:58em mais um Fala Aí,
17:00falando sobre esses assuntos cada vez mais atuais,
17:03trazendo pra vocês toda uma reflexão
17:05sobre o nosso momento.
17:06Semana que vem, terça-feira,
17:08tem mais a coluna
17:10fala aí aqui com a gente.
Comentários