What are the key themes driving AI through 2026 according to the synthesis?

Six themes are highlighted as drivers of AI through 2026: enterprise adoption; energy limits; compute economics and pricing dynamics; hardware battles and accelerator strategies; model diversity, including open weights and small on-device models; and geopolitical fragmentation of the technology stack. Together they shape where capacity, investment, and leadership will concentrate by 2026.

How might AI adoption reach an inflection point in 2026?

Adoption is already widespread, but ROI remains uneven, with many firms still transitioning from pilots to real value after multi-year programs. The analysis argues that if more enterprises publish concrete returns from reorganizing data access and internal platforms, an adoption inflection could emerge in 2026, turning AI from pilots into broad productivity growth despite governance and security challenges.

What energy and compute capacity constraints are emphasized?

Energy is singled out as a principal constraint, with data-center builds having long lead times and interconnection queues stretching for years. To keep pace, builders may pursue behind-the-meter generation, hydrogen or gas peakers, or solar-plus-storage. Consequently, compute capacity will chase available and resilient energy, favoring regions that rapidly expand capacity with renewables, while slow grid reform risks leaving others behind.

How does model diversity affect governance and competition?

Model diversity now encompasses frontier models, open-weight ecosystems, and compact on-device models, giving organizations a spectrum of choices from cloud-hosted boundary models to private, on-premise inference. This diversity lowers entry barriers and broadens innovation beyond a few incumbents, but it also complicates governance because each model type carries different failure modes, licensing terms, and geopolitical associations, contributing to fragmentation of the tech stack.

Mapeando os Próximos 24 Meses da IA

Traçando o mapa

Esta semana, uma síntese amplamente lida de quatro ensaios apresentou uma visão única e integrada do que determinará a trajetória da IA nos próximos 18 a 24 meses. O documento trata o período que se aproxima como uma janela estreita de testes: as empresas transformarão projetos-piloto em valor escalonado? As redes elétricas e as cadeias de suprimentos acompanharão o apetite por computação? Os mercados e os governos conseguirão se adaptar à mudança exponencial?

A resposta, por enquanto, é mista. A pilha tecnológica (stack) está explodindo em diversidade — grandes modelos de fronteira, pesos abertos com licenciamento permissivo, pequenos modelos construídos para telefones e robôs — enquanto os sistemas físicos e institucionais que permitem que empresas e países implementem IA em escala estão sob estresse agudo. Essas tensões definem os prováveis vencedores e perdedores de 2026.

Adoção empresarial e a inflexão da produtividade

A adoção já é generalizada: pesquisas mostram que a grande maioria das organizações utiliza IA em pelo menos uma função. No entanto, apenas uma minoria relata hoje a criação de valor clara e mensurável. O padrão assemelha-se ao de tecnologias de propósito geral anteriores: um punhado de líderes pioneiros — bancos, plataformas de software e algumas empresas nativas da nuvem — capturam grandes ganhos primeiro, enquanto a maioria reformula processos, governança e habilidades.

O que torna os próximos 12 a 18 meses críticos é a forma dessa difusão. Várias grandes empresas publicam agora retornos concretos de programas plurianuais: elas reorganizaram o acesso aos dados, construíram plataformas internas e realizaram o árduo trabalho de integração antes de colher os benefícios. Se esses estudos de caso se multiplicarem, uma inflexão clássica de adoção poderá chegar em 2026, deslocando a IA do estágio piloto para um amplo crescimento da produtividade.

Mas existem dinâmicas compensatórias. Funcionários já recorrem à IA de consumo em dispositivos pessoais; o uso informal pode acelerar a adoção, mas também cria lacunas de governança e segurança. Os conselhos de administração estão apostando alto — a maioria das empresas aumentou os orçamentos de IA no último ano e planeja novos aumentos — o que significa que as expectativas de ROI visível serão altas e a pressão política sobre os CIOs, intensa.

Receita, uso e a economia de tokens

As receitas comerciais da IA generativa dispararam. Estimativas situam o setor em dezenas de bilhões de dólares e crescendo a taxas comparáveis à adoção inicial da nuvem. Os serviços baseados em API são o segmento mais rápido: as empresas pagam pelo acesso à computação e ao modelo, e o surgimento de fluxos de trabalho agênticos e de múltiplas etapas elevou o consumo de tokens por usuário muito acima das simples interações de chat.

Essa combinação — ampliação da adoção e cargas de trabalho mais pesadas — pode elevar as receitas mesmo quando a maioria das empresas ainda está apenas começando a operacionalizar as capacidades. As empresas gerenciarão cada vez mais os custos com roteamento de modelos e arquiteturas híbridas, mas os provedores que detêm o caminho de inferência de alta capacidade estão posicionados para capturar o maior valor.

Energia e o muro da escala física

Entre as restrições apontadas com mais ênfase está a energia. Construir um data center é rápido em comparação com os prazos de mais de uma década que muitos projetos de rede e interconexão exigem. Em vários mercados importantes, as filas de interconexão estendem-se por anos, forçando os construtores de data centers a considerar a geração "atrás do medidor" (behind-the-meter), geradores de pico a gás ou hidrogênio dedicados, ou novos projetos de energia solar com armazenamento.

A consequência prática é que a capacidade de computação buscará cada vez mais energia disponível e resiliente, em vez de simplesmente baixa latência para os clientes. Regiões que podem expandir rapidamente a capacidade — usando renováveis isoladas ou de rápida implementação — atrairão grandes clusters. Regiões com reformas de rede lentas correm o risco de perder. O resultado é uma geografia física da computação mais do que um mercado abstrato: a disponibilidade de energia moldará onde as maiores instalações de IA serão instaladas.

Guerras de hardware e a questão das GPUs

A história do fornecimento de chips volta a ser importante. A competição entre incumbentes e desafiantes em aceleradores de IA está se acirrando: novas famílias de GPUs e aceleradores construídos para fins específicos são centrais para as ofertas de nuvem e estratégias soberanas. Um grande competidor lançou novos aceleradores que pressionam o líder de mercado em preço e desempenho, e grandes clientes de nuvem já estão fazendo apostas em diferentes fornecedores.

Isso importa porque o ciclo de depreciação e substituição dos aceleradores determina a intensidade de capital e o timing estratégico. Se os aceleradores de ponta tiverem vidas produtivas medidas em muitos anos, isso suaviza os ciclos de substituição. Se a demanda por treinamento e inferência superar a oferta, os preços e as margens mudam, e os players menores são espremidos. Chassis de servidores, resfriamento e integrações de cadeia de suprimentos — recentemente consolidados por aquisições — agora fazem parte da competição de plataformas, não apenas dos roteiros de semicondutores.

Diversidade de modelos: abertos, pequenos e nacionais

O fornecimento de modelos não é mais um jogo de dois jogadores. Em 2025, vários modelos de fronteira foram lançados ao lado de um ecossistema florescente de pesos abertos e uma classe madura de modelos pequenos, executados no dispositivo (on-device). O resultado prático é a escolha: as organizações podem escolher modelos de fronteira fechados e hospedados na nuvem; pesos abertos hospedados localmente; ou modelos leves ajustados para latência, privacidade e operação offline.

Essa diversificação tem três efeitos imediatos. Primeiro, reduz as barreiras de entrada para empresas que precisam de inferência local (on-prem) ou privada. Segundo, descentraliza a inovação, permitindo que laboratórios acadêmicos e fornecedores menores contribuam com avanços sem orçamentos massivos de treinamento. Terceiro, complica a governança: modelos diferentes vêm com diferentes modos de falha, termos de licenciamento e associações geopolíticas.

Stacks soberanas e fragmentação geopolítica

As políticas e o capital estão reorganizando a pilha global. Nações e blocos tratam cada vez mais as capacidades de computação e de modelos como infraestrutura estratégica a ser gerida, não apenas regulamentada. Grandes estados e investidores subnacionais ricos estão financiando clusters regionais, e alianças estão se formando em torno de fornecedores preferenciais de hardware e software.

O resultado intermediário provável é um cenário fragmentado de stacks alinhadas aos EUA, alinhadas à China e não alinhadas. Nações de médio porte enfrentam uma escolha difícil: adotar uma stack estrangeira e aceitar dependências, ou construir capacidades domésticas caras e arriscar-se a ficar para trás na adoção econômica. O agrupamento multinacional e consórcios minilaterais são uma mitigação plausível, mas o atrito político e os incentivos comerciais tornarão a coordenação difícil.

Confiança, utilidade e o pacto social

Há uma tensão social crescente: a adoção e a familiaridade estão surgindo mesmo enquanto a confiança do público enfraquece. Grandes parcelas da população relatam preocupação com os efeitos da IA, mesmo quando dependem de ferramentas de IA para codificação, escrita e suporte à decisão. Isso cria um pacto social frágil — utilidade hoje em troca da exposição a riscos desconhecidos amanhã.

A forma como as instituições, plataformas e reguladores gerenciarem esse pacto moldará a aceitação. Transparência, salvaguardas verificáveis e comunicações realistas sobre capacidades e limites influenciarão se a regulamentação se tornará habilitadora ou proibitiva. Na ausência de uma governança credível, a fragmentação e a reação pública podem retardar a difusão e concentrar o valor naqueles que podem operar com o menor número de restrições.

O que observar nos próximos 24 meses

Vários marcadores concretos decidirão se o período se tornará uma inflexão ou uma pausa. Primeiro, sinais de ROI empresarial: uma parcela significativa de grandes empresas publicará ganhos de produtividade mensuráveis além de estudos de caso isolados? Segundo, reformas de energia e interconexão: os operadores de rede e os regimes de licenciamento podem reduzir os prazos onde os clusters estão planejados? Terceiro, fornecimento de hardware: os aceleradores continuam escassos ou a produção ganha escala? Quarto, a disseminação de pesos abertos e modelos implantáveis localmente: eles deslocarão materialmente a dependência da nuvem para cargas de trabalho regulamentadas e sensíveis à privacidade?

Finalmente, os movimentos geopolíticos importam: novos projetos multilaterais de computação, investimentos soberanos e controles de exportação poderiam redesenhar quem tem acesso prático às capacidades de fronteira. A interação entre economia, física e política determinará se os próximos dois anos consolidarão algumas plataformas dominantes ou ampliarão os comuns tecnológicos.

Em suma, os próximos 18 a 24 meses não são meramente mais um ciclo de produto: eles são um teste para saber se as organizações, as redes elétricas e os governos conseguem se adaptar aos pontos de pressão que o rápido progresso da IA já expôs. Observadores e tomadores de decisão devem acompanhar os três sistemas interligados — tecnologia, infraestrutura e instituições — porque o sucesso exige que os três escalem juntos.

Mapeando os Próximos 24 Meses da IA

Traçando o mapa

Adoção empresarial e a inflexão da produtividade

Receita, uso e a economia de tokens

Energia e o muro da escala física

Guerras de hardware e a questão das GPUs

Diversidade de modelos: abertos, pequenos e nacionais

Stacks soberanas e fragmentação geopolítica

Confiança, utilidade e o pacto social

O que observar nos próximos 24 meses

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments