Ir diretamente para o conteúdo

O que a aposta de 200 mil milhões de dólares da Nvidia em CPUs para agentes de IA significa para a sua empresa

A próxima grande aposta da Nvidia: 200 mil milhões de dólares em CPUs para agentes de IA

Jensen Huang não é conhecido por fazer previsões modestas. O CEO da Nvidia, que transformou a sua empresa de placas gráficas numa potência da IA avaliada em mais de 3 biliões de dólares, tem agora os olhos postos no que denomina um mercado «totalmente novo» de 200 mil milhões de dólares. Desta vez, não se trata de treinar modelos de IA, mas sim dos processadores que irão alimentar os agentes de IA no nosso trabalho e na nossa vida quotidiana, marcando uma mudança fundamental no desenvolvimento do negócio da IA.

Em intervenções realizadas em eventos recentes do setor, Huang delineou a visão da Nvidia relativamente a CPUs especializadas, concebidas especificamente para agentes de IA — os assistentes de software autónomos que estão a passar rapidamente da ficção científica para a realidade empresarial. Embora as GPUs tenham dominado o boom da formação em IA, Huang acredita que as CPUs otimizadas para inferência irão impulsionar a próxima vaga de adoção da inteligência artificial.

Por que é que os agentes de IA precisam de chips diferentes

A transição do treino de modelos de IA para a implementação de agentes de IA representa uma mudança fundamental nos requisitos computacionais. O treino de grandes modelos linguísticos, como o GPT-4 ou o Claude, requer uma enorme capacidade de processamento paralelo — exatamente aquilo em que as GPUs H100 e A100 da Nvidia se destacam. No entanto, a execução de agentes de IA que interagem com os utilizadores, tomam decisões e executam tarefas em tempo real exige capacidades computacionais diferentes.

Os agentes de IA precisam de processar vários tipos de dados em simultâneo — texto, imagens, dados de sensores e respostas de API —, mantendo simultaneamente uma baixa latência e a eficiência energética. O seu objetivo não é tanto analisar conjuntos de dados massivos, mas sim tomar decisões rápidas e contextuais com base em entradas em constante mudança.

É aqui que entram as CPUs especializadas. Ao contrário das GPUs, que se destacam no processamento paralelo, as CPUs são concebidas para tarefas sequenciais complexas, lógica de ramificação e gestão de múltiplos fluxos de trabalho — exatamente o que os agentes de IA fazem quando agendam as suas reuniões, analisam dados de mercado ou coordenam dispositivos domésticos inteligentes.

Os argumentos comerciais a favor dos processadores de agentes de IA

A previsão de Huang, no valor de 200 mil milhões de dólares, não se refere apenas às vendas de hardware — trata-se de possibilitar uma categoria totalmente nova de aplicações empresariais. As empresas já estão a experimentar agentes de IA para atendimento ao cliente, qualificação de vendas, análise de dados e automatização de processos. No entanto, as soluções atuais dependem frequentemente do processamento na nuvem, o que gera problemas de latência e custos contínuos que limitam a sua eficácia.

O processamento de agentes de IA no dispositivo pode alterar completamente essa equação. Imagine assistentes de IA que respondem instantaneamente porque estão a funcionar localmente, ou sistemas de fabrico em que os agentes de IA coordenam a produção sem necessidade de ligação à Internet. As aplicações empresariais são vastas, abrangendo tudo, desde veículos autónomos a ambientes de retalho inteligentes.

Concorrência e realidade do mercado

A Nvidia não é a única a reconhecer esta oportunidade. A Intel, a AMD e a ARM estão todas a desenvolver processadores otimizados para a inferência de IA. Os chips Snapdragon da Qualcomm já equipam funcionalidades de IA em smartphones, enquanto os processadores da série M da Apple incluem motores neurais dedicados para o processamento de IA no próprio dispositivo.

O principal fator diferenciador será a integração do ecossistema. A plataforma CUDA da Nvidia proporcionou-lhe uma enorme vantagem no treino de IA, uma vez que os programadores já estavam familiarizados com as ferramentas. A empresa aposta que o seu ecossistema de software, combinado com hardware especificamente concebido para o efeito, irá criar vantagens semelhantes no mercado dos agentes de IA.

Mas este mercado ainda é, em grande parte, teórico. Embora os chatbots de IA e as ferramentas de automação simples estejam a tornar-se comuns, os agentes de IA verdadeiramente autónomos que justificam o uso de hardware especializado continuam, na sua maioria, em fase de desenvolvimento. A questão de 200 mil milhões de dólares é se as empresas irão adotar os agentes de IA com rapidez suficiente para impulsionar a procura por processadores dedicados.

O que isto significa para os líderes empresariais

Para as empresas que estão a avaliar estratégias de IA, a previsão da Nvidia aponta para várias tendências importantes. Em primeiro lugar, o mercado da IA está a passar da fase de experimentação para a implementação em produção. Em segundo lugar, o futuro da IA empresarial será provavelmente mais distribuído, com o processamento a ocorrer localmente, em vez de se realizar inteiramente na nuvem.

Isto poderá ter um impacto significativo na forma como as organizações planeiam a sua infraestrutura de IA. Em vez de dependerem exclusivamente de APIs na nuvem, as empresas poderão ter de considerar capacidades de computação de ponta para agentes de IA com grande capacidade de resposta. A análise custo-benefício da implementação da IA poderá sofrer uma mudança drástica se o processamento local especializado se tornar a norma, especialmente à medida que as empresas de IA demonstram caminhos mais claros para a rentabilidade e modelos de negócio sustentáveis.

A visão de Huang sugere também que os agentes de IA se tornarão suficientemente sofisticados para justificar o uso de hardware dedicado — o que implica capacidades muito além dos simples chatbots e ferramentas de automação atuais. Para os líderes empresariais, isto reforça a importância de desenvolver conhecimentos sobre IA e flexibilidade de infraestruturas já agora, antes que a próxima vaga de soluções de inteligência artificial transforme os requisitos operacionais.

Resta saber se a previsão de Huang, no valor de 200 mil milhões de dólares, se concretizará, mas o seu historial na identificação de tendências transformadoras em matéria de IA faz com que valha a pena levá-la a sério. As empresas que se preparam hoje para a implementação de agentes de IA poderão vir a estar em melhor posição para o panorama da automação inteligente do futuro.

Quando os agentes de IA se tornarem tão comuns como os smartphones, os processadores especializados poderão ser o que os tornará verdadeiramente úteis.

Editor Aimeetslife

Escrito por

Oliver K.G

Oliver K.G é o fundador da AI Meets Life, uma publicação que ajuda os profissionais de negócios dos EUA a ignorar o ruído e a aplicar a IA onde realmente importa — nas suas equipas, fluxos de trabalho e resultados financeiros. Acompanha as ferramentas, tendências e decisões que moldam o futuro do trabalho.