Aposta do 'modelo mundial' do Google: construir a camada operacional da IA antes que a Microsoft capture a IU

Assine nossos boletins diários e semanais para receber as últimas atualizações e conteúdo exclusivo sobre a cobertura líder do setor em IA. Saiba mais
Após três horas no evento I/O 2025 do Google, na semana passada, no Vale do Silício, ficou cada vez mais claro: o Google está reunindo seus formidáveis esforços em IA – com a marca Gemini, mas abrangendo uma gama diversificada de arquiteturas de modelos e pesquisas subjacentes – com foco preciso. A empresa está lançando uma série de inovações e tecnologias em torno dela, integrando-as em produtos em um ritmo alucinante.
Além de recursos que chamam a atenção, o Google apresentou uma ambição mais ousada: um sistema operacional para a era da IA – não do tipo que inicializa por disco, mas uma camada lógica que todos os aplicativos pudessem acessar – um "modelo de mundo" destinado a alimentar um assistente universal que entende nosso ambiente físico, raciocina e age em nosso nome. É uma ofensiva estratégica que muitos observadores podem ter perdido em meio à confusão de recursos.
Por um lado, é uma estratégia arriscada para superar concorrentes consolidados. Mas, por outro, enquanto o Google investe bilhões nessa jornada, uma questão crucial surge: será que o brilhantismo do Google em pesquisa e tecnologia de IA pode se traduzir em produtos mais rapidamente do que seus rivais, cuja vantagem tem seu próprio brilho: empacotar a IA em produtos imediatamente acessíveis e comercialmente potentes ? Será que o Google conseguirá superar uma Microsoft focada em laser, afastar os sonhos de hardware vertical da OpenAI e, principalmente, manter seu próprio império de buscas vivo em meio às correntes disruptivas da IA?
O Google já está buscando esse futuro em uma escala vertiginosa. Pichai disse ao I/O que a empresa agora processa 480 trilhões de tokens por mês – 50 vezes mais do que há um ano – e quase 5 vezes mais do que os 100 trilhões de tokens por mês que Satya Nadella, da Microsoft, disse que sua empresa processava. Esse impulso também se reflete na adoção por desenvolvedores, com Pichai dizendo que mais de 7 milhões de desenvolvedores estão agora construindo com a API Gemini, representando um aumento de cinco vezes desde o último I/O, enquanto o uso do Gemini no Vertex AI aumentou mais de 40 vezes. E os custos unitários continuam caindo, à medida que os modelos Gemini 2.5 e o Ironwood TPU extraem mais desempenho de cada watt e dólar. O Modo AI (em implementação nos EUA) e as Visões Gerais de AI (que já atendem 1,5 bilhão de usuários mensalmente) são os bancos de testes ao vivo onde o Google ajusta a latência, a qualidade e os formatos de anúncios futuros à medida que muda a pesquisa para uma era que prioriza a IA.

A aposta do Google no que chama de " modelo mundial" – uma IA que pretende dotar de um profundo conhecimento das dinâmicas do mundo real – e, com ela, a visão de um assistente universal – um que seja desenvolvido pelo Google, e não por outras empresas – cria outra grande tensão: quanto controle o Google deseja sobre esse assistente onisciente, construído sobre sua joia da coroa, a busca? Ele quer, principalmente, aproveitá-lo para si mesmo, para salvar seu negócio de buscas de US$ 200 bilhões, que depende de possuir o ponto de partida e evitar a disrupção causada pela OpenAI? Ou o Google abrirá totalmente sua IA fundamental para que outros desenvolvedores e empresas a aproveitem – outro segmento que representa uma parcela significativa de seus negócios, envolvendo mais de 20 milhões de desenvolvedores, mais do que qualquer outra empresa ?
Às vezes, ele parou antes de um foco radical na construção desses produtos principais para os outros com a mesma clareza de seu inimigo, a Microsoft. Isso porque ele mantém muitas funcionalidades principais reservadas para seu querido mecanismo de busca. Dito isso, o Google está fazendo esforços significativos para fornecer acesso ao desenvolvedor sempre que possível. Um exemplo revelador é o Projeto Mariner . O Google poderia ter incorporado os recursos de automação do navegador agentic diretamente dentro do Chrome, dando aos consumidores uma vitrine imediata sob o controle total do Google. No entanto, o Google seguiu dizendo que os recursos de uso do computador do Mariner seriam lançados por meio da API Gemini de forma mais ampla "neste verão". Isso sinaliza que o acesso externo está chegando para qualquer rival que queira automação comparável. Na verdade, o Google disse que os parceiros Automation Anywhere e UiPath já estavam construindo com ele.
A articulação mais clara do grande projeto do Google veio de Demis Hassabis, CEO do Google DeepMind, durante a palestra do I/O. Ele afirmou que o Google continuava a "redobrar" os esforços em direção à inteligência artificial geral (IAG). Embora o Gemini já fosse "o melhor modelo multimodal", explicou Hassabis, o Google está trabalhando arduamente para "ampliá-lo e torná-lo o que chamamos de modelo mundial. Ou seja, um modelo que pode fazer planos e imaginar novas experiências simulando aspectos do mundo, assim como o cérebro faz".
O conceito de "modelo de mundo", conforme articulado por Hassabis, consiste em criar uma IA que aprenda os princípios básicos de como o mundo funciona – simulando causa e efeito, compreendendo a física intuitiva e, por fim, aprendendo pela observação, de forma muito semelhante à de um ser humano. Um indicador inicial, talvez facilmente ignorado por aqueles não familiarizados com a pesquisa fundamental em IA, mas significativo, dessa direção é o trabalho do Google DeepMind em modelos como o Genie 2. Essa pesquisa mostra como gerar ambientes de jogos interativos e bidimensionais e mundos jogáveis a partir de estímulos variados, como imagens ou texto. Ela oferece um vislumbre de uma IA capaz de simular e compreender sistemas dinâmicos.
Hassabis desenvolveu esse conceito de "modelo mundial" e sua manifestação como um "assistente universal de IA" em diversas palestras desde o final de 2024, e foi apresentado na I/O de forma mais abrangente – com o CEO Sundar Pichai e o líder da Gemini, Josh Woodward, ecoando a visão no mesmo palco. (Enquanto outros líderes de IA, incluindo Satya Nadella, da Microsoft, Sam Altman, da OpenAI, e Elon Musk, da xAI, discutiram "modelos mundiais", o Google vincula de forma única e abrangente esse conceito fundamental ao seu impulso estratégico de curto prazo: o "assistente universal de IA".)
Falando sobre o aplicativo Gemini, o equivalente do Google ao ChatGPT da OpenAI, Hassabis declarou: “Esta é nossa visão definitiva para o aplicativo Gemini: transformá-lo em um assistente de IA universal, uma IA pessoal, proativa e poderosa, e um dos nossos principais marcos no caminho para a AGI.”
Essa visão se tornou tangível por meio de demonstrações de E/S. O Google demonstrou um novo aplicativo chamado Flow – uma tela de criação cinematográfica com recurso de arrastar e soltar que preserva a consistência dos personagens e da câmera – que utiliza o Veo 3, o novo modelo que sobrepõe vídeo com reconhecimento de física e áudio nativo. Para Hassabis, essa combinação é uma prova inicial de que "a compreensão do modelo de mundo já está se infiltrando nas ferramentas criativas". Para a robótica, ele destacou separadamente o modelo aprimorado da Gemini Robotics, argumentando que "os sistemas de IA precisarão de modelos de mundo para operar com eficácia".
O CEO Sundar Pichai reforçou isso , citando o Projeto Astra que "explora as capacidades futuras de um assistente de IA universal que pode entender o mundo ao seu redor". Essas capacidades do Astra, como compreensão de vídeo ao vivo e compartilhamento de tela, agora estão integradas ao Gemini Live . Josh Woodward, que lidera o Google Labs e o aplicativo Gemini, detalhou a meta do aplicativo de ser o "assistente de IA mais pessoal, proativo e poderoso". Ele demonstrou como o "contexto pessoal" (conectando o histórico de pesquisa e, em breve, o Gmail/Calendário) permite que o Gemini antecipe necessidades, como fornecer testes de exames personalizados ou vídeos explicativos personalizados usando analogias que um usuário entende (por exemplo, termodinâmica explicada por meio do ciclismo). Isso, enfatizou Woodward, é "para onde estamos indo com o Gemini", habilitado pelo modelo Gemini 2.5 Pro, permitindo que os usuários "pensem nas coisas e as façam existir".
As novas ferramentas para desenvolvedores reveladas no I/O são blocos de construção. O Gemini 2.5 Pro com "Deep Think" e o hipereficiente Flash 2.5 (agora com áudio nativo e contexto de URL baseado na API Gemini ) formam a inteligência principal. O Google também apresentou discretamente o Gemini Diffusion , sinalizando sua disposição de ir além das pilhas Transformer puras quando isso resultar em maior eficiência ou latência. O Google está reunindo esses recursos em um kit de ferramentas completo: o AI Studio e o Firebase Studio são os principais pontos de partida para desenvolvedores, enquanto o Vertex AI continua sendo a rampa de acesso empresarial.
Este empreendimento colossal é impulsionado pela enorme capacidade de P&D do Google, mas também por necessidade estratégica. No cenário de software empresarial, a Microsoft tem uma posição formidável, disse um diretor de IA da Fortune 500 à VentureBeat, tranquilizando os clientes com seu total comprometimento com o desenvolvimento do Copilot . O executivo pediu anonimato devido à sensibilidade de comentar sobre a intensa competição entre os provedores de nuvem de IA. O domínio da Microsoft nos aplicativos de produtividade do Office 365 será excepcionalmente difícil de ser superado por meio da competição direta entre recursos, afirmou o executivo.
O caminho do Google para uma liderança potencial – sua "vantagem" em torno do domínio corporativo da Microsoft – reside na redefinição do jogo com um paradigma de interação nativo de IA fundamentalmente superior. Se o Google oferecer um "assistente de IA verdadeiramente universal" impulsionado por um modelo de mundo abrangente, ele poderá se tornar a nova camada indispensável – o sistema operacional eficaz – para a interação de usuários e empresas com a tecnologia. Como Pichai refletiu com o podcaster David Friedberg pouco antes do I/O, isso significa consciência do ambiente físico. E então, óculos de realidade aumentada, disse Pichai, " talvez esse seja o próximo salto... é isso que me empolga ".
Mas esta ofensiva da IA é uma corrida contra múltiplos relógios. Primeiro, o mecanismo de anúncios de busca de US$ 200 bilhões que financia o Google precisa ser protegido, mesmo que seja reinventado. A decisão de monopolização do Departamento de Justiça dos EUA ainda paira sobre o Google – a alienação do Chrome tem sido apontada como a principal solução. E na Europa, a Lei de Mercados Digitais, bem como processos emergentes de responsabilidade por direitos autorais, podem limitar a liberdade com que o Gemini rastreia ou exibe a web aberta.
Finalmente, a velocidade de execução importa. O Google tem sido criticado por se mover lentamente nos últimos anos. Mas, nos últimos 12 meses, ficou claro que o Google tem trabalhado pacientemente em várias frentes e que isso tem valido a pena com um crescimento mais rápido do que os rivais . O desafio de navegar com sucesso nessa transição de IA em grande escala é imenso, como evidenciado pelo recente relatório da Bloomberg detalhando como até mesmo um titã da tecnologia como a Apple está lutando com contratempos significativos e reorganizações internas em suas iniciativas de IA. Essa dificuldade em todo o setor ressalta os altos riscos para todos os participantes. Embora Pichai não tenha o talento de alguns rivais, a longa lista de depoimentos de clientes corporativos que o Google exibiu em seu evento Cloud Next no mês passado – sobre implantações reais de IA – destaca um líder que deixa a cadência sustentada do produto e as vitórias corporativas falarem por si.
Ao mesmo tempo, concorrentes focados avançam. A marcha empresarial da Microsoft continua. Sua conferência Build apresentou o Microsoft 365 Copilot como a "IU para IA", o Azure AI Foundry como uma "linha de produção para inteligência" e o Copilot Studio para construção sofisticada de agentes, com demonstrações impressionantes de fluxo de trabalho de baixo código ( Microsoft Build Keynote, Miti Joshi às 22:52, Kadesha Kerr às 51:26 ). A visão de "web aberta e agêntica" de Nadella ( NLWeb, MCP ) oferece às empresas um caminho pragmático para a adoção de IA, permitindo a integração seletiva de tecnologia de IA – seja do Google ou de outro concorrente – dentro de uma estrutura centrada na Microsoft.
A OpenAI, por sua vez, está muito à frente com o alcance do consumidor de seu produto ChatGPT, com referências recentes da empresa a ter 600 milhões de usuários mensais e 800 milhões de usuários semanais. Isso se compara aos 400 milhões de usuários mensais do aplicativo Gemini. E em dezembro, a OpenAI lançou uma oferta de busca completa e está supostamente planejando uma oferta de anúncios – representando o que poderia ser uma ameaça existencial ao modelo de busca do Google. Além de fazer modelos líderes, a OpenAI está fazendo uma jogada vertical provocativa com sua suposta aquisição de US$ 6,5 bilhões da IO de Jony Ive , prometendo ir "além desses produtos legados" – e insinuando que estava lançando um produto de hardware que tentaria interromper a IA assim como o iPhone interrompeu o celular. Embora tudo isso possa potencialmente interromper as ambições de computação pessoal de próxima geração do Google, também é verdade que a capacidade da OpenAI de construir um fosso profundo como a Apple fez com o iPhone pode ser limitada em uma era de IA cada vez mais definida por protocolos abertos (como o MCP) e intercambiabilidade de modelos mais fácil.
Internamente, o Google navega em seu vasto ecossistema. Como Jeanine Banks, vice-presidente de Desenvolvedores X do Google, disse à VentureBeat, atender à diversificada comunidade global de desenvolvedores do Google significa que "não existe uma solução única para todos", resultando em uma gama rica, mas às vezes complexa, de ferramentas – AI Studio, Vertex AI, Firebase Studio e inúmeras APIs.
Enquanto isso, a Amazon está pressionando por outro lado: a Bedrock já hospeda os modelos Anthropic, Meta, Mistral e Cohere, dando aos clientes da AWS um padrão pragmático e multimodelo.
A tentativa audaciosa do Google de desenvolver a inteligência fundamental para a era da IA apresenta aos líderes empresariais oportunidades atraentes e considerações críticas:
- Mude agora ou adapte mais tarde: atrasar um ciclo de lançamento pode forçar reescritas custosas quando interfaces que priorizam o assistente se tornam padrão.
- Aproveite o potencial revolucionário: para organizações que buscam adotar a IA mais poderosa, aproveitar a pesquisa do "modelo mundial" do Google, os recursos multimodais (como Veo 3 e Imagen 4 apresentados por Woodward no I/O) e a trajetória da AGI prometida pelo Google oferecem um caminho para uma inovação potencialmente significativa.
- Prepare-se para um novo paradigma de interação: o sucesso do "assistente universal" do Google significaria uma nova interface primária para serviços e dados. As empresas devem elaborar estratégias para integração por meio de APIs e frameworks de agentes para entrega com reconhecimento de contexto.
- Considere o longo prazo (e seus riscos): Alinhar-se à visão do Google é um compromisso de longo prazo. O "modelo mundial" completo e a IA são horizontes potencialmente distantes. Os tomadores de decisão devem equilibrar isso com as necessidades imediatas e as complexidades da plataforma.
- Contraste com alternativas focadas: soluções pragmáticas da Microsoft oferecem produtividade empresarial tangível agora. A IA de hardware disruptiva da OpenAI/IO apresenta outro caminho distinto. Uma estratégia diversificada, aproveitando o melhor de cada uma, muitas vezes faz sentido, especialmente com a web agêntica cada vez mais aberta permitindo tal flexibilidade.
Essas escolhas complexas e estratégias de adoção de IA no mundo real serão o centro das discussões no Transform 2025 da VentureBeat, no próximo mês. O importante evento independente reúne tomadores de decisões técnicas corporativas com líderes de empresas pioneiras para compartilhar experiências em primeira mão sobre escolhas de plataformas – Google, Microsoft e outras – e como navegar na implantação de IA, tudo com curadoria da equipe editorial da VentureBeat. Com vagas limitadas, recomenda-se a inscrição antecipada.
O espetáculo I/O do Google foi uma declaração contundente: o Google sinalizou que pretende arquitetar e operar a inteligência fundamental do futuro impulsionado pela IA. Sua busca por um "modelo mundial" e suas ambições em IA (AGI) visam redefinir a computação, superar concorrentes e garantir seu domínio. A audácia é convincente; a promessa tecnológica é imensa.
A grande questão é a execução e o timing. Será que o Google conseguirá inovar e integrar suas vastas tecnologias em uma experiência coesa e envolvente mais rápido do que os concorrentes consolidaram suas posições? Será que conseguirá fazer isso ao mesmo tempo em que transforma a busca e enfrenta desafios regulatórios? E conseguirá fazer isso com um foco tão amplo tanto nos consumidores quanto nos negócios – uma agenda que é, sem dúvida, muito mais ampla do que a de seus principais concorrentes?
Os próximos anos serão cruciais. Se o Google concretizar sua visão de "modelo mundial", poderá inaugurar uma era de inteligência personalizada e ambiental, tornando-se efetivamente a nova camada operacional para nossas vidas digitais. Caso contrário, sua grande ambição poderá servir de alerta para um gigante que busca tudo, apenas para encontrar o futuro definido por outros que miraram de forma mais específica e mais rápida.
Se você quer impressionar seu chefe, o VB Daily tem tudo o que você precisa. Damos informações privilegiadas sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights e obter o máximo ROI.
Leia nossa Política de Privacidade
Obrigado por assinar. Confira mais newsletters do VB aqui .
Ocorreu um erro.

venturebeat