Giambattista Parascandolo, o matemático italiano da OpenAI que ensina máquinas a raciocinar

Às vezes, para mudar o mundo, você só precisa parar e pensar. É isso que os novos modelos de IA desenvolvidos pela OpenAI fazem. O último é chamado o3 e é um modelo de raciocínio. Comparado ao ChatGPT-4, ele não dá respostas imediatas: leva tempo. Ele reflete, comete erros, corrige-se, melhora. E a boa notícia é que quem o ensina a raciocinar é um jovem pesquisador italiano. Criado até os cinco anos de idade com o método Montessori, ele aprendeu o básico que agora aplica aos modelos de inteligência artificial.
Ele é Giambattista Parascandolo, 33 anos, matemático, bacharel pela Tor Vergata, mestre pela Finlândia, doutor em aprendizado de máquina pelo Instituto Max Planck em Tübingen e pela ETH Zurique. Ele foi o primeiro italiano a ingressar na OpenAI, há quatro anos, quando a empresa ainda era uma pequena startup de pesquisa com 150 pessoas. Hoje, são quase 2000 e estão entre as empresas privadas mais capitalizadas da história em nível global.
Parascandolo lidera uma equipe que trabalha em Inteligência Artificial Geral e modelos de raciocínio que foram considerados revolucionários. Modelos projetados não para fornecer a primeira resposta possível, mas para parar e pensar. «Dante levou quinze anos para escrever a Divina Comédia . Se ele tivesse um prazo de um mês, o mesmo trabalho não teria saído. O que ele fez naqueles anos? Ele pensou, escreveu rascunhos, corrigiu-os, pensou novamente, refez seus passos. Agora, esses modelos funcionam assim: quanto mais eles pensam, melhores são suas respostas. E seus pensamentos podem ser lidos. Basta passar o mouse sobre ele. Eles aparecem e desaparecem. Eles dizem: “Espere, isso pode ser dito melhor”. “Deixe-me verificar novamente esse cálculo.” “O usuário está perguntando isso… Preciso ter certeza de que tudo faz sentido.” Ao lê-los, você percebe que eles são surpreendentemente semelhantes aos pensamentos de um ser humano."
Cientista, Parascandolo desenvolveu a base técnica para esses modelos aprenderem a raciocinar ao redor do mundo.
Romano, filho de um jornalista da Rai, Renato Parascandolo, ex-diretor da Rai Educacional, e de um diretor de documentários culturais, Giambattista, cresceu com o método Montessori. Com meus pais, aprendi o valor do aprendizado e da exploração. Na creche Montessori, recebi uma educação baseada na prática, na liberdade e na criatividade em um ambiente estruturado. Combinei os dois métodos. Hoje, fazemos o mesmo com as máquinas: não as ensinamos a raciocinar, criamos o ambiente para que elas possam fazer isso sozinhas.
Ouvi-lo falar é uma maravilha. Giambattista é frequentemente enviado para explicar ao governador da Califórnia ou aos senadores o que eles fazem na OpenAI. Conheça as delegações italianas que vão para o Vale do Silício. Conte-nos sobre o potencial dessas ferramentas e o que o futuro reserva. Temos todos os ingredientes em mãos para continuar aprimorando esses sistemas. Estou otimista de que será um progresso contínuo. Foi uma verdadeira aventura e continua sendo, mas vivo tudo isso com um forte senso de responsabilidade.
Parascandolo se interessa por como a mente funciona desde criança. “Sempre me fiz as perguntas clássicas de quem eu sou, o que eu quero, por quê... Mas eu não buscava respostas filosóficas. Eu buscava respostas pragmáticas. Sempre quis trabalhar em algo que tivesse a ver com a compreensão da mente. Mas eu não sabia o quê.” Ele começou a ler livros do neurologista e escritor Oliver Sacks e periódicos de neurociência: “Eu procurava todas as maneiras de abordar este mundo, mas nunca as encontrei”. Ensino médio clássico (“A estrutura dos estudos me entediava profundamente”). Ele primeiro se matriculou em Engenharia, depois abandonou o curso e começou a estudar matemática. O Erasmus na Finlândia lhe mostrará o caminho.
Eu tinha 23 anos. As redes neurais artificiais estavam começando a funcionar graças a uma nova geração de hardware, cada vez mais potente. Percebi que havia algo interessante ali: uma maneira de estudar a mente sem abrir mão da matemática. Nesse momento ele decidiu orientar todos os seus estudos para a inteligência artificial, mas ainda não havia um treinamento estruturado sobre IA. Então ele começou a estudar por conta própria, fazendo aulas na universidade pela Internet.
“Na época, havia pouquíssimos professores ensinando redes neurais. Mas alguns disponibilizavam seus cursos online.” Estude e tente entrar no DeepMind. Era a única empresa que estava trabalhando seriamente em IA. Mas para ser contratado, era preciso ter doutorado. Então, fiz um doutorado em ciência da computação e IA, entre a Suíça e a Alemanha. Durante o curso, ele fez dois estágios: um em Palo Alto, no Google X, em 2018, e um na própria DeepMind, em Londres, em 2019. Depois, voltou para concluir o doutorado, mas chegou a pandemia e as empresas suspenderam as contratações. Enquanto isso, ele se candidata a uma vaga de professor no MIT, em Boston, liderando um programa de pesquisa sobre raciocínio em redes neurais. E aqui ele começa a entrar em choque com as perplexidades da velha escola. “Fiz umas 20 entrevistas. Cheguei ao fim e, mesmo assim, minha pesquisa não era convincente. Vários professores me disseram que aquela linha de pesquisa não fazia sentido. Que redes neurais eram uma moda passageira, sem futuro. Foi uma experiência muito formativa, que depois vi acontecer um pouco de forma geral na área de IA.”
Uma mudança de paradigma estava ocorrendo, e nem todos estavam prontos. Houve uma primeira onda de inteligência artificial com uma abordagem completamente diferente, baseada principalmente em regras lógicas, ou seja, mais em código padrão. Mas houve uma pequena corrente que disse: não, o caminho certo não é colocar inteligência no código, mas construir um cérebro artificial que aprende sozinho. Mas por muito tempo, as redes neurais artificiais não funcionaram muito bem, especialmente porque o hardware ainda não estava pronto. Não havia as GPUs que usamos hoje para treinar nossos modelos. Então, elas começaram a funcionar. Mas, nesse meio tempo, o campo havia se transformado, construído sobre os fundamentos do paradigma anterior. E para muitos professores foi difícil aceitar o novo paradigma.
Essa rejeição no MIT, no entanto, não fecha o caminho. Pelo contrário. A Covid passa, as empresas voltam a contratar, Giambattista termina o doutorado e chegam duas ofertas: uma da própria DeepMind, outra daquela que era apenas uma startup num prédio caindo aos pedaços em São Francisco: a OpenAI. "Escolhi ir ver o que estava acontecendo nos EUA: eles tinham acabado de publicar o GPT-3. Quando cheguei, a OpenAI tinha um pequeno escritório em São Francisco, mas a energia era incrível." Quatro anos depois, a empresa cresceu e se tornou uma gigante com 14 escritórios ao redor do mundo e mais de 500 milhões de usuários ativos semanais.
O que você quer dizer com trabalhar com raciocínio de modelos? “Não dizemos à máquina o que fazer. Construímos ambientes para que ela aprenda sozinha. Isso se chama aprendizado por reforço: em vez de treinar a IA com dados clássicos, criamos um ambiente o mais interessante possível para que ela aprenda sozinha. Por tentativa e erro. É um pouco como o método Montessori: você coloca a criança em um ambiente estimulante, com jogos, computadores, Lego. Um ambiente cheio de possibilidades, sem supervisão, e você a deixa livre para explorar. E ela aprende sem que nenhum professor lhe diga: você tem que aprender isso. Mesmo com a inteligência artificial funciona assim: se você der a ela um ambiente bem projetado, ela aprende pela experiência, comete erros, os corrige, melhora”. Se você perguntar a ele sobre Sam Altman, ele dirá que é um cara muito tranquilo. “De vez em quando conversamos nos corredores.” Se você perguntar sobre a mais recente aquisição da OpenAI, a startup "io" fundada pelo ex-designer responsável pelos maiores sucessos da Apple, Jonathan Ive , com o objetivo de redefinir a relação entre humanos e inteligência artificial, ele responde: "Não sei nada fora da minha área de pesquisa direta. Trabalho com raciocínio, não com dispositivos." Então ele sorri. Dos pais: “Eles são muito apaixonados e usam o ChatGPT todos os dias.” Da Itália: “Nossa formação universitária é muito teórica. Deveríamos aprender a programar desde cedo: programar também é uma coisa muito divertida de se fazer. Nunca tinha ouvido falar de programação até chegar à universidade, quando já era tarde demais. Muitos dos meus colegas vêm da Polônia: desde cedo, eles têm um interesse muito grande por matemática e programação.”
O que você aprendeu sobre IA que poderíamos aprender? Risos. Ele permanece em silêncio por quase dois minutos. Ele pensa sobre isso. Então ele brinca. “O raciocínio é importante.” E ele diz: “Há muitos erros que nós, humanos, comumente cometemos. Às vezes, respondemos rápido demais, sem pensar o suficiente. Ou esquecemos um sinal durante uma multiplicação de colunas. Bem, é interessante ver que a inteligência artificial também comete erros quase idênticos. Erros humanos, muito diferentes daqueles que os computadores cometiam no passado. Mas, como nós, as máquinas também melhoram com o esforço. O bonito é que o número de erros diminui com a prática, com a aplicação, com o trabalho meticuloso. É algo que talvez devêssemos lembrar: não apreciamos o suficiente o quanto você pode aprender simplesmente decidindo fazê-lo. Com a inteligência artificial, o progresso pode ser medido: você pode colocá-lo em um gráfico, contar o número de erros por minuto, os problemas resolvidos em uma hora. E você descobre passo a passo que o aprendizado melhora. E isso leva você longe”. Vamos voltar a estudar. Se não for agora, quando?
La Repubblica