Líderes empresariais dizem que a receita para agentes de IA é combiná-los com processos existentes — e não o contrário

Quer insights mais inteligentes na sua caixa de entrada? Assine nossas newsletters semanais para receber apenas o que importa para líderes empresariais em IA, dados e segurança. Assine agora
Não há dúvidas de que os agentes de IA — aqueles que podem trabalhar de forma autônoma e assíncrona nos bastidores dos fluxos de trabalho corporativos — são o assunto do momento nas empresas.
Mas há uma preocupação crescente de que tudo isso seja apenas isso — conversa fiada, muita propaganda enganosa, sem muita substância por trás.
A Gartner, por exemplo, observa que as empresas estão no “ pico das expectativas infladas ”, um período pouco antes da desilusão se instalar porque os fornecedores não respaldaram suas falas com casos de uso tangíveis e reais.
Ainda assim, isso não quer dizer que as empresas não estejam experimentando agentes de IA e observando um retorno antecipado sobre o investimento (ROI); as empresas globais Block e GlaxoSmithKline (GSK), por sua vez, estão explorando provas de conceitos em serviços financeiros e descoberta de medicamentos.
O escalonamento da IA atinge seus limites
Limites de energia, aumento nos custos de tokens e atrasos na inferência estão remodelando a IA empresarial. Participe do nosso salão exclusivo para descobrir como as principais equipes estão:
- Transformando energia em vantagem estratégica
- Arquitetando inferência eficiente para ganhos reais de produtividade
- Desbloqueando o ROI competitivo com sistemas de IA sustentáveis
Garanta sua vaga e fique na frente : https://bit.ly/4mwGngO
"Multiagente é definitivamente o que vem por aí, mas estamos descobrindo como isso se parece de uma forma que atenda ao ser humano e seja conveniente", disse Brad Axen, líder de tecnologia da Block para plataformas de IA e dados, ao CEO e editor-chefe da VentureBeat, Matt Marshall, em um recente evento AI Impact patrocinado pela SAP neste mês.
A Block, empresa controladora das empresas Square, Cash App e Afterpay, com 10.000 funcionários, considera-se em modo de descoberta total, tendo lançado uma estrutura de agente de IA interoperável, codinome goose , em janeiro.
O Goose foi inicialmente introduzido para tarefas de engenharia de software e agora é usado por 4.000 engenheiros, com a adoção dobrando a cada mês, explicou a Axen. A plataforma escreve cerca de 90% do código e economizou aos engenheiros cerca de 10 horas de trabalho por semana, automatizando a geração de código, a depuração e a filtragem de informações.
Além de escrever código, Goose atua como uma espécie de "companheiro de equipe digital", compactando fluxos de e-mail e do Slack, integrando ferramentas da empresa e gerando novos agentes quando as tarefas exigem mais produtividade e escopo expandido.
Axen enfatizou que o Block está focado em criar uma interface que transmita a sensação de trabalhar com um único colega, não com um enxame de bots. "Queremos que você sinta como se estivesse trabalhando com uma pessoa, mas ela está agindo em seu nome em muitos lugares e de muitas maneiras diferentes", explicou.
O Goose opera em tempo real no ambiente de desenvolvimento, pesquisando, navegando e escrevendo código com base na saída do modelo de linguagem grande (LLM), ao mesmo tempo em que lê e escreve arquivos de forma autônoma, executa código e testes, refina saídas e instala dependências.
Basicamente, qualquer pessoa pode construir e operar um sistema em seu LLM preferido, e o Goose pode ser conceituado como a camada de aplicação. Ele possui um aplicativo desktop e uma interface de linha de comando integrados, mas os desenvolvedores também podem criar interfaces de usuário personalizadas. A plataforma é construída sobre o Model Context Protocol (MCP) da Anthropic, um conjunto padronizado de APIs e endpoints de código aberto cada vez mais popular que conecta agentes a repositórios de dados, ferramentas e ambientes de desenvolvimento.
O Goose foi lançado sob a licença Apache 2.0 (ASL2) de código aberto, o que significa que qualquer pessoa pode usá-lo, modificá-lo e distribuí-lo livremente, mesmo para fins comerciais. Os usuários podem acessar bancos de dados do Databricks e fazer chamadas ou consultas SQL sem precisar de conhecimento técnico.
“Queremos realmente criar um processo que permita que as pessoas extraiam valor do sistema sem precisar ser um especialista”, explicou Axen.
Por exemplo, na programação, os usuários podem dizer o que desejam em linguagem natural, e o framework interpretará isso em milhares de linhas de código que os desenvolvedores podem ler e analisar. A Block também está identificando valor em tarefas de compressão, como a leitura do Goose no Slack, e-mail e outros canais, e o resumo de informações para os usuários. Além disso, em vendas ou marketing, os agentes podem coletar informações relevantes sobre um cliente em potencial e transferi-las para um banco de dados.
Agentes de IA subutilizados, mas a expertise do domínio humano ainda é necessáriaO processo tem sido o maior gargalo, observou a Axen. Não se pode simplesmente dar uma ferramenta às pessoas e dizer a elas para fazê-la funcionar; os agentes precisam refletir os processos com os quais os funcionários já estão engajados. Usuários humanos não estão preocupados com a estrutura técnica — mas sim com o trabalho que estão tentando realizar.
Os construtores, portanto, precisam observar o que os funcionários estão tentando fazer e projetar as ferramentas para que sejam "o mais literalmente possível", disse Axen. Assim, eles podem usar isso para encadear e enfrentar problemas cada vez maiores.
“Acho que estamos subutilizando enormemente o que eles podem fazer”, disse Axen sobre os agentes. “São as pessoas e o processo, porque não conseguimos acompanhar a tecnologia. Há uma enorme lacuna entre a tecnologia e a oportunidade.”
E, quando a indústria superar isso, ainda haverá espaço para a expertise humana? Claro, afirma Axen. Por exemplo, especialmente em serviços financeiros, o código deve ser confiável, compatível e seguro para proteger a empresa e os usuários; portanto, deve ser revisado por olhos humanos.
“Ainda vemos um papel realmente crucial para especialistas humanos em todas as áreas operacionais da nossa empresa”, disse ele. “Isso não muda necessariamente o significado de expertise como indivíduo. Apenas lhe dá uma nova ferramenta para expressá-la.”
A IU humana é um dos elementos mais difíceis dos agentes de IA, observou Axen; o objetivo é tornar as interfaces simples de usar enquanto a IA está em segundo plano agindo proativamente.
Seria útil, observou Axen, se mais participantes do setor incorporassem padrões semelhantes aos do MCP. Por exemplo, "Eu adoraria que o Google simplesmente tivesse um MCP público para o Gmail", disse ele. "Isso facilitaria muito a minha vida."
Quando questionado sobre o comprometimento da Block com o código aberto, ele observou: "sempre tivemos uma espinha dorsal de código aberto", acrescentando que, no último ano, a empresa "renovou" seu investimento em tecnologias abertas.
“Em um espaço que está evoluindo tão rápido, esperamos poder estabelecer uma governança de código aberto para que esta seja a ferramenta que acompanha você mesmo com o lançamento de novos modelos e produtos.”
A GSK é uma desenvolvedora farmacêutica líder, com foco específico em vacinas, doenças infecciosas e pesquisa oncológica. Agora, a empresa está começando a aplicar arquiteturas multiagentes para acelerar a descoberta de medicamentos.
Kim Branson, vice-presidente sênior e chefe global de IA e ML da GSK, disse que os agentes estão começando a transformar o produto da empresa e são "absolutamente essenciais para o nosso negócio".
Os cientistas da GSK estão combinando LLMs específicos de domínio com ontologias (conceitos e categorias de assuntos que indicam propriedades e relações entre eles), cadeias de ferramentas e estruturas de testes rigorosas, explicou Branson.
Isso os ajuda a consultar conjuntos gigantescos de dados científicos, planejar experimentos (mesmo sem a devida informação) e reunir evidências em genômica (o estudo do DNA), proteômica (o estudo das proteínas) e dados clínicos. Os agentes podem levantar hipóteses, validar junções de dados e comprimir ciclos de pesquisa.
Branson observou que a descoberta científica avançou muito; os tempos de sequenciamento diminuíram e a pesquisa em proteômica está muito mais rápida. Ao mesmo tempo, porém, a descoberta se torna cada vez mais difícil à medida que mais e mais dados são acumulados, principalmente por meio de dispositivos e wearables. Como Branson afirmou: "Temos mais dados contínuos de pulso sobre as pessoas do que jamais tivemos como espécie."
Pode ser quase impossível para humanos analisar todos esses dados, então o objetivo da GSK é usar IA para acelerar os tempos de iteração, ele observou.
Mas, ao mesmo tempo, a IA pode ser complicada na indústria farmacêutica porque muitas vezes não há uma verdade fundamental sem a realização de grandes experimentos clínicos; trata-se mais de hipóteses e cientistas explorando evidências para chegar a possíveis soluções.
“Quando você começa a adicionar agentes, percebe que a maioria das pessoas nem sequer tem uma maneira padrão de fazer isso entre si”, observou Branson. “Essa variação não é ruim, mas às vezes leva a outra questão.”
Ele brincou: “Nem sempre temos uma verdade absoluta para trabalhar — caso contrário, meu trabalho seria muito mais fácil.”
Trata-se de encontrar os alvos certos ou saber como projetar o que poderia ser um biomarcador ou evidência para diferentes hipóteses, explicou ele. Por exemplo: esta é a melhor opção a ser considerada para pessoas com câncer de ovário nesta condição específica?
Para que a IA entenda esse raciocínio, é necessário o uso de ontologias e a formulação de perguntas como: "Se isso for verdade, o que significa X?". Agentes de domínio específico podem então reunir evidências relevantes de grandes conjuntos de dados internos.
A GSK construiu do zero modelos de linguagem epigenômica com tecnologia Cerebras, que utiliza para inferência e treinamento, explicou Branson. "Construímos modelos muito específicos para nossas aplicações, onde ninguém mais tem um", disse ele.
A velocidade de inferência é importante, observou ele, seja para a interação com um modelo ou para pesquisas profundas e autônomas, e a GSK utiliza diferentes conjuntos de ferramentas com base no objetivo final. Mas grandes janelas de contexto nem sempre são a resposta, e a filtragem é crucial. "Não se pode simplesmente jogar contextos repetitivos", disse Branson. "Não se pode simplesmente jogar todos os dados nessa coisa e confiar que o LM vai descobrir."
A GSK realiza muitos testes em seus sistemas de agentes, priorizando o determinismo e a confiabilidade, muitas vezes executando vários agentes em paralelo para verificar os resultados.
Branson lembrou que, quando sua equipe começou a construir, eles tinham um agente SQL que executaram "10.000 vezes" e, inexplicavelmente, de repente, ele "falsificou" detalhes.
“Nunca vimos isso acontecer novamente, mas aconteceu uma vez e nem entendemos por que aconteceu com este LLM em particular”, disse ele.
Como resultado, sua equipe frequentemente executará várias cópias e modelos em paralelo enquanto impõe chamadas de ferramentas e restrições; por exemplo, dois LLMs executarão exatamente a mesma sequência e os cientistas da GSK farão uma verificação cruzada.
Sua equipe se concentra em ciclos de aprendizagem ativos e está montando seus próprios benchmarks internos porque os populares e disponíveis ao público geralmente são "bastante acadêmicos e não refletem o que fazemos".
Por exemplo, eles gerarão diversas perguntas biológicas, pontuarão o que eles acham que será o padrão ouro e, então, aplicarão um LLM com base nisso e verão como ele se classifica.
“Procuramos principalmente por coisas problemáticas que não funcionaram ou que fizeram algo estúpido, porque é aí que aprendemos coisas novas”, disse Branson. “Tentamos fazer com que os humanos usem seu julgamento especializado onde for necessário.”
Se você quer impressionar seu chefe, o VB Daily tem tudo o que você precisa. Damos informações privilegiadas sobre o que as empresas estão fazendo com IA generativa, desde mudanças regulatórias até implementações práticas, para que você possa compartilhar insights e obter o máximo ROI.
Leia nossa Política de Privacidade
Obrigado por assinar. Confira mais newsletters do VB aqui .
Ocorreu um erro.

venturebeat