What are the key themes driving AI through 2026 according to the synthesis?

Six themes are highlighted as drivers of AI through 2026: enterprise adoption; energy limits; compute economics and pricing dynamics; hardware battles and accelerator strategies; model diversity, including open weights and small on-device models; and geopolitical fragmentation of the technology stack. Together they shape where capacity, investment, and leadership will concentrate by 2026.

How might AI adoption reach an inflection point in 2026?

Adoption is already widespread, but ROI remains uneven, with many firms still transitioning from pilots to real value after multi-year programs. The analysis argues that if more enterprises publish concrete returns from reorganizing data access and internal platforms, an adoption inflection could emerge in 2026, turning AI from pilots into broad productivity growth despite governance and security challenges.

What energy and compute capacity constraints are emphasized?

Energy is singled out as a principal constraint, with data-center builds having long lead times and interconnection queues stretching for years. To keep pace, builders may pursue behind-the-meter generation, hydrogen or gas peakers, or solar-plus-storage. Consequently, compute capacity will chase available and resilient energy, favoring regions that rapidly expand capacity with renewables, while slow grid reform risks leaving others behind.

How does model diversity affect governance and competition?

Model diversity now encompasses frontier models, open-weight ecosystems, and compact on-device models, giving organizations a spectrum of choices from cloud-hosted boundary models to private, on-premise inference. This diversity lowers entry barriers and broadens innovation beyond a few incumbents, but it also complicates governance because each model type carries different failure modes, licensing terms, and geopolitical associations, contributing to fragmentation of the tech stack.

Mappare i prossimi 24 mesi dell'IA

Tracciare la mappa

Questa settimana una sintesi molto letta di quattro saggi ha presentato una visione d'insieme su ciò che determinerà la traiettoria dell'IA nei prossimi 18–24 mesi. Il documento tratta il prossimo periodo come una finestra ristretta di test: le aziende trasformeranno i progetti pilota in valore di scala? Le reti elettriche e le catene di approvvigionamento terranno il passo con il fabbisogno di calcolo? I mercati e i governi sapranno adattarsi a un cambiamento esponenziale?

La risposta, per ora, è contrastante. Lo stack tecnologico sta esplodendo in termini di diversità — grandi modelli di frontiera, modelli open weights con licenze permissive, piccoli modelli costruiti per telefoni e robot — mentre i sistemi fisici e istituzionali che consentono a aziende e paesi di distribuire l'IA su larga scala sono sotto forte pressione. Queste tensioni definiranno i probabili vincitori e vinti del 2026.

Adozione aziendale e il punto di svolta della produttività

L'adozione è già diffusa: i sondaggi mostrano che la grande maggioranza delle organizzazioni utilizza l'IA in almeno una funzione. Eppure, solo una minoranza riferisce oggi una creazione di valore chiara e misurabile. Il modello ricalca quello delle precedenti tecnologie di uso generale: un manipolo di leader precoci — banche, piattaforme software e alcune aziende cloud-native — cattura per prima i grandi vantaggi, mentre la maggioranza ristruttura processi, governance e competenze.

Ciò che rende critici i prossimi 12–18 mesi è la forma di tale diffusione. Diverse grandi imprese pubblicano ora rendimenti concreti derivanti da programmi pluriennali: hanno riorganizzato l'accesso ai dati, costruito piattaforme interne e affrontato il duro lavoro di integrazione prima di raccogliere i benefici. Se questi casi di studio si moltiplicheranno, nel 2026 potrebbe arrivare un classico punto di svolta nell'adozione, spostando l'IA dalla fase pilota a una crescita diffusa della produttività.

Esistono però dinamiche contrapposte. I dipendenti ricorrono già all'IA consumer sui dispositivi personali; l'uso informale può accelerare l'adozione, ma crea anche falle nella governance e nella sicurezza. I consigli di amministrazione stanno scommettendo pesantemente — la maggior parte delle aziende ha aumentato i budget per l'IA nell'ultimo anno e ne pianifica altri aumenti — il che significa che le aspettative per un ROI visibile saranno alte e la pressione politica sui CIO intensa.

Ricavi, utilizzo e la token economy

I ricavi commerciali per l'IA generativa sono impennati. Le stime valutano il settore in decine di miliardi di dollari, con tassi di crescita paragonabili a quelli della prima adozione del cloud. I servizi basati su API sono il segmento più veloce: le aziende pagano per il calcolo e l'accesso ai modelli, e l'ascesa di workflow agentici e multi-fase ha spinto il consumo di token per utente ben oltre le semplici interazioni via chat.

Questa combinazione — ampliamento dell'adozione e carichi di lavoro più pesanti — può far lievitare i ricavi anche se la maggior parte delle aziende sta ancora iniziando a rendere operative le funzionalità. Le imprese gestiranno sempre più i costi con l'instradamento dei modelli (model routing) e architetture ibride, ma i fornitori che controllano il percorso di inferenza ad alta capacità sono destinati a catturare la maggior parte del valore.

Energia e il limite fisico della scalabilità

Tra i vincoli segnalati con maggiore enfasi c'è l'energia. Costruire un data center è veloce rispetto ai tempi di realizzazione di oltre un decennio necessari per molti progetti di rete e interconnessione. In diversi mercati chiave, le code di interconnessione si estendono per anni, costringendo i costruttori di data center a considerare la generazione behind-the-meter, centrali a gas di picco o a idrogeno dedicate, o nuovi progetti di solare con accumulo.

La conseguenza pratica è che la capacità di calcolo inseguirà sempre più l'energia disponibile e resiliente, piuttosto che la semplice bassa latenza verso i clienti. Le regioni che possono espandere rapidamente la capacità — utilizzando energie rinnovabili isolate o a rapida implementazione — attireranno grandi cluster. Le regioni con riforme lente della rete rischiano di restare escluse. Il risultato è una geografia fisica del calcolo più che un mercato astratto: la disponibilità di energia determinerà dove sorgeranno le più grandi installazioni di IA.

Guerre dell'hardware e la questione delle GPU

La storia dell'approvvigionamento dei chip torna a essere cruciale. La competizione tra leader consolidati e sfidanti negli acceleratori di IA si sta inasprendo: nuove famiglie di GPU e acceleratori costruiti ad hoc sono centrali per le offerte cloud e le strategie sovrane. Un importante concorrente ha distribuito nuovi acceleratori che mettono sotto pressione il leader di mercato su prezzo e prestazioni, e i grandi clienti cloud stanno già piazzando scommesse su diversi fornitori.

Questo è importante perché il ciclo di ammortamento e sostituzione degli acceleratori determina l'intensità di capitale e il tempismo strategico. Se gli acceleratori di fascia alta godranno di vite produttive misurabili in molti anni, ciò alleggerirà i cicli di sostituzione. Se la domanda di addestramento e inferenza supererà l'offerta, i prezzi e i margini cambieranno, e i player più piccoli verranno schiacciati. Gli chassis dei server, il raffreddamento e le integrazioni della catena di approvvigionamento — recentemente consolidati da acquisizioni — fanno ora parte della competizione tra piattaforme, non solo delle roadmap dei semiconduttori.

Diversità dei modelli: aperti, piccoli e nazionali

L'offerta di modelli non è più una partita a due. Nel 2025 sono stati lanciati diversi modelli di frontiera insieme a un florido ecosistema open-weight e a una classe matura di piccoli modelli on-device. Il risultato pratico è la possibilità di scelta: le organizzazioni possono optare per modelli di frontiera chiusi e ospitati in cloud, open weights ospitati localmente o modelli leggeri ottimizzati per latenza, privacy e funzionamento offline.

Questa diversificazione ha tre effetti immediati. In primo luogo, abbassa le barriere all'ingresso per le aziende che necessitano di inferenza on-premise o privata. In secondo luogo, decentralizza l'innovazione, consentendo ai laboratori accademici e ai fornitori più piccoli di contribuire con scoperte significative senza enormi budget per l'addestramento. In terzo luogo, complica la governance: modelli diversi comportano diverse modalità di errore, termini di licenza e associazioni geopolitiche.

Stack sovrani e frammentazione geopolitica

La politica e il capitale stanno riorganizzando lo stack globale. Le nazioni e i blocchi trattano sempre più la capacità di calcolo e i modelli come infrastrutture strategiche da gestire, non solo da regolamentare. Grandi stati e ricchi investitori sub-nazionali stanno finanziando cluster regionali, e si stanno formando alleanze attorno a fornitori di hardware e software preferiti.

Il probabile esito intermedio è un panorama frammentato di stack allineati agli USA, allineati alla Cina e non allineati. Le nazioni di medie dimensioni affrontano una scelta difficile: adottare uno stack straniero e accettare le dipendenze, oppure costruire costose capacità nazionali rischiando di restare indietro nell'adozione economica. Il pooling multinazionale e i consorzi minilaterali sono una possibile mitigazione, ma l'attrito politico e gli incentivi commerciali renderanno difficile il coordinamento.

Fiducia, utilità e il patto sociale

C'è una crescente tensione sociale: l'adozione e la familiarità stanno aumentando proprio mentre la fiducia del pubblico si indebolisce. Ampie fasce della popolazione riferiscono preoccupazione per gli effetti dell'IA, pur affidandosi agli strumenti di IA per la programmazione, la scrittura e il supporto decisionale. Ciò crea un patto sociale fragile: utilità oggi in cambio dell'esposizione a rischi sconosciuti domani.

Il modo in cui le istituzioni, le piattaforme e i regolatori gestiranno questo patto determinerà l'accettazione. La trasparenza, i guardrail verificabili e una comunicazione realistica su capacità e limiti influenzeranno se la regolamentazione diventerà abilitante o proibitiva. In assenza di una governance credibile, la frammentazione e il contraccolpo pubblico potrebbero rallentare la diffusione e concentrare il valore in chi può operare con il minor numero di vincoli.

Cosa monitorare nei prossimi 24 mesi

Diversi indicatori concreti decideranno se questo periodo sarà un punto di svolta o una pausa. In primo luogo, i segnali di ROI aziendale: una quota significativa di grandi imprese pubblicherà guadagni di produttività misurabili oltre i casi di studio isolati? In secondo luogo, le riforme dell'energia e dell'interconnessione: i gestori di rete e i regimi di autorizzazione riusciranno a ridurre i tempi di realizzazione dove sono pianificati i cluster? In terzo luogo, l'offerta di hardware: gli acceleratori rimarranno scarsi o la produzione aumenterà di scala? In quarto luogo, la diffusione di open weights e modelli distribuibili localmente: sostituiranno materialmente la dipendenza dal cloud per i carichi di lavoro regolamentati e sensibili alla privacy?

Infine, contano le mosse geopolitiche: nuovi progetti di calcolo multilaterali, investimenti sovrani e controlli sulle esportazioni potrebbero ridisegnare chi ha l'accesso pratico alle capacità di frontiera. L'interazione tra economia, fisica e politica determinerà se i prossimi due anni bloccheranno poche piattaforme dominanti o amplieranno i beni comuni tecnologici.

In breve, i prossimi 18–24 mesi non sono solo un altro ciclo di prodotto: sono un test per verificare se le organizzazioni, le reti elettriche e i governi possono adattarsi ai punti di pressione che il rapido progresso dell'IA ha già esposto. Gli osservatori e i decisori dovrebbero monitorare i tre sistemi collegati — tecnologia, infrastruttura e istituzioni — perché il successo richiede che tutti e tre scalino insieme.

Mappare i prossimi 24 mesi dell'IA

Tracciare la mappa

Adozione aziendale e il punto di svolta della produttività

Ricavi, utilizzo e la token economy

Energia e il limite fisico della scalabilità

Guerre dell'hardware e la questione delle GPU

Diversità dei modelli: aperti, piccoli e nazionali

Stack sovrani e frammentazione geopolitica

Fiducia, utilità e il patto sociale

Cosa monitorare nei prossimi 24 mesi

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments