È iniziata la guerra dei prezzi dell'AI. Grandi aziende e startup, esasperate dai costi in rapida crescita dell'intelligenza artificiale, si stanno rivolgendo sempre più a strumenti che sfruttano modelli di AI più economici, inclusi alcuni provenienti dalla Cina. Questo sta aumentando la pressione sui leader del settore, OpenAI e Anthropic, affinché riducano i prezzi, una prospettiva che potrebbe compromettere la loro capacità di crescere e diventare imprese redditizie.
I nuovi strumenti per il risparmio sui costi aiutano le aziende a contenere le spese per l'AI passando dinamicamente da un mix di modelli di AI di terze parti a sistemi di AI interni, costruiti utilizzando modelli open source liberamente disponibili.
L'ecosistema consente ai sistemi di AI autonomi, o agenti, di utilizzare modelli economici, inclusi quelli realizzati da aziende cinesi come Alibaba e DeepSeek, per molte funzioni. Gli agenti utilizzano le versioni più performanti di ChatGPT di OpenAI e Claude di Anthropic solo per i compiti più complessi. Questo può ridurre i costi per alcune attività assistite dall'AI fino al 95%, secondo i dirigenti che utilizzano questi strumenti.
«Una volta trovato qualcosa che funziona bene e che piace agli ingegneri, troviamo il modo di renderlo economicamente vantaggioso», ha affermato Dan Robinson, fondatore di Detail, una startup specializzata nell'identificazione di bug. «C'è davvero un'abbondanza di soluzioni innovative che provengono dai laboratori open source». Robinson ha spostato il 90% del carico di lavoro di Detail da Claude e Gemini di Google a modelli personalizzati e GLM, una famiglia di modelli sviluppati in Cina.
Il passaggio a modelli più economici sembra aver contribuito al recente calo di un indice ampiamente seguito che monitora la spesa per l’AI, secondo un rapporto pubblicato questa settimana da Citadel Securities. «Anche le tecnologie più potenti devono sottostare alla disciplina pragmatica delle curve dei costi, dei vincoli di capacità e dei rendimenti marginali», si legge nel rapporto.
OpenAI sta valutando tagli drastici ai prezzi che applica agli utenti di AI, in vista di riduzioni simili previste da Anthropic, come riportato dal Wall Street Journal. L'azienda ritiene di avere un vantaggio in uno scenario del genere perché nell'ultimo anno ha speso somme ingenti per assicurarsi l'accesso a risorse informatiche a prezzi di gran lunga inferiori a quelli attuali.
L'amministratore delegato Sam Altman ha dichiarato in un recente evento aziendale che i costi sono improvvisamente diventati «un problema enorme».
La crescente guerra dei prezzi minaccia di ampliare le perdite di OpenAI e Anthropic, che già perdono miliardi di dollari all'anno per finanziare la potenza di calcolo necessaria a costruire e gestire sistemi di intelligenza artificiale avanzati. Entrambe le società hanno depositato la documentazione riservata in vista di una potenziale offerta pubblica iniziale.
La pressione sui prezzi dell'AI rappresenta anche un nuovo elemento nel dibattito di lunga data sulla possibilità che i concorrenti con costi inferiori standardizzino i modelli di AI nei prossimi anni, o se il rapido ritmo di miglioramento delle maggiori aziende del settore consentirà loro di mantenere il primato. Sia OpenAI che Anthropic offrono anche modelli più economici, ai quali possono indirizzare i clienti per ottenere costi inferiori.
«Non serve un modello che conosca la gravità quantistica», ha affermato Vishal Misra, vicedecano di informatica e intelligenza artificiale presso la facoltà di ingegneria della Columbia University. «Questi modelli open source sono molto performanti e la possibilità di applicare prezzi elevati per l'AI è destinata a diminuire».
Anche le aziende statunitensi stanno cercando di sfruttare l'ondata di modelli di AI più economici. Microsoft ha presentato la scorsa settimana una suite di modelli di AI più compatti che, a suo dire, possono operare in modo più efficiente rispetto ai modelli all'avanguardia. Il colosso dei chip Nvidia ha lanciato Nemotron, una famiglia di modelli più economici che sta guadagnando terreno, e ha anche investito in Reflection, una startup che sviluppa AI open source.
I modelli open source cinesi stanno guadagnando popolarità tra le aziende americane. La quota di mercato di DeepSeek nell'utilizzo dell’AI è passata dall'1% di aprile al 17% di maggio sulla piattaforma della startup Vercel, ha dichiarato l'azienda.
Su OpenRouter, un'altra startup che elabora query di AI, DeepSeek è stata l'azienda di AI più utilizzata da metà maggio. Tra i clienti che spendono di più, l'utilizzo di token open source è cresciuto quattro volte più velocemente rispetto a quello di token proprietari tra l'autunno del 2025 e la primavera del 2026, ha affermato OpenRouter. L'azienda ha anche visto più di 500 organizzazioni passare da modelli proprietari a modelli open source.
Ottimizzare la spesa per l'AI può comportare calcoli complessi. I modelli open source costano molto meno per token, l'unità di base del calcolo dell'AI. Il modello Fable 5 di Anthropic, rilasciato di recente, costa oltre 50 volte di più per token rispetto al V4 Pro di DeepSeek, ad esempio.
Tuttavia, secondo i ricercatori, i migliori modelli proprietari di aziende come OpenAI, Anthropic o Google rimangono dai quattro ai sei mesi avanti rispetto ai concorrenti open source. In alcuni casi, ciò significa che possono completare un'attività complessa utilizzando un numero inferiore di token, con conseguente riduzione del costo totale.
«Le aziende valutano sempre più i modelli in base al prezzo per attività: quanto costa completare un'attività, dall'inizio alla fine, e non in base al prezzo per token», ha affermato un portavoce di Anthropic. L'azienda offre anche modelli a prezzi più accessibili, ha aggiunto il portavoce.
La startup Lindy, specializzata in assistenti esecutivi basati sull'intelligenza artificiale, ha iniziato a esplorare il modello V4 di DeepSeek due mesi fa, ha dichiarato il fondatore Flo Crivello. Lui e il suo team di 25 persone hanno sviluppato un'ampia gamma di strumenti interni per verificare se il modello open-source cinese fosse in grado di gestire le attività di Lindy, come la gestione di caselle di posta e calendari, la stesura di email e la trascrizione di riunioni.
Hanno scoperto che DeepSeek gestiva queste attività altrettanto bene di Sonnet di Anthropic, risultando particolarmente efficace nella gestione delle email. Inoltre, ha aggiunto Crivello, era 10 volte più economico. L'azienda utilizza ancora un modello Anthropic più avanzato per la programmazione interna, ma nel complesso questa scelta ha permesso di risparmiare milioni di dollari, ha affermato Crivello.
Molte aziende hanno iniziato a progettare i propri modelli di intelligenza artificiale utilizzando alternative open-source e affermano di essere riuscite a ridurre i costi dell'AI. Quando le aziende sviluppano modelli interni e li addestrano con i dati aziendali, le loro prestazioni possono migliorare o addirittura superare le capacità dei modelli di IA più avanzati, affermano i dirigenti.
Altri hanno iniziato a utilizzare strumenti che combinano diversi modelli di intelligenza artificiale a seconda dei costi e delle attività da svolgere. «Le nostre IA attuali sono così avare e parsimoniose», ha affermato Andrew Moore, ex responsabile di Google Cloud AI, la cui startup Lovelace AI ha sviluppato una piattaforma volta a rendere gli agenti AI più efficienti. «Sanno esattamente come ottenere il massimo dai modelli più economici possibili. Quando incontrano difficoltà, passano temporaneamente a un modello più sofisticato e costoso».
Matan Grinberg, ceo di Factory, azienda che offre strumenti di programmazione autonoma e ha sviluppato un prodotto che utilizza una combinazione di modelli di AI, ha dichiarato che nelle ultime settimane il suo telefono ha squillato ininterrottamente, con dirigenti di alto livello di settori che spaziano dalla finanza alle telecomunicazioni, che lo hanno contattato per cercare di ridurre le spese in A. «Questa guerra dei prezzi sarà positiva e noi vogliamo contribuire a favorirla», ha affermato Grinberg.
News Corp, proprietaria del Wall Street Journal, ha una partnership per la licenza dei contenuti con OpenAI.