DeepSeek AI Development costa $ 1,6 miliardi, mito di debunking economici
Il nuovo chatbot di Deepseek ha avuto un impatto significativo nel mercato dell'IA, causando uno dei maggiori calo dei prezzi delle azioni di Nvidia a causa del suo vantaggio competitivo. Introdotto con la promessa di rispondere alle domande in modi sorprendenti, DeepSeek si è rapidamente posizionato come un attore formidabile nel settore.
Immagine: Ensigame.com
Ciò che distingue il modello di DeepSeek è la sua architettura innovativa e metodi di formazione. La società impiega diverse tecnologie avanzate, tra cui:
Multi-Token Prediction (MTP) : questo metodo consente al modello di prevedere più parole contemporaneamente analizzando diverse parti di una frase, migliorando significativamente sia l'accuratezza che l'efficienza.
Miscela di esperti (MOE) : utilizzando 256 reti neurali, con otto attivate per ogni attività di elaborazione dei token, questa architettura accelera la formazione dell'intelligenza artificiale e migliora le prestazioni.
Attenzione latente multi-testa (MLA) : questo meccanismo si concentra sulle parti più significative di una frase, estraendo più volte i dettagli chiave per ridurre la possibilità di perdere informazioni importanti, catturando così sfumature cruciali nei dati di input.
Immagine: Ensigame.com
DeepSeek, un'importante startup cinese, afferma di aver sviluppato un modello di intelligenza artificiale competitivo, Deepseek V3, ad un costo minimo di $ 6 milioni per la formazione, utilizzando solo 2048 processori grafici. Tuttavia, gli analisti di seminalisi hanno scoperto che la società gestisce effettivamente una vasta infrastruttura computazionale, comprendente circa 50.000 GPU di Nvidia Hopper, tra cui 10.000 unità H800, 10.000 H100 e ulteriori GPU H20, diffuse su più data center. Queste risorse sono utilizzate non solo per la formazione AI, ma anche per la ricerca e la modellizzazione finanziaria.
L'investimento totale nei server di DeepSeek è stimato in $ 1,6 miliardi, con spese operative che hanno raggiunto $ 944 milioni. Come sussidiaria dell'hedge fund cinese High-Flyer, DeepSeek è stato trasformato nel 2023 per concentrarsi sulle tecnologie di intelligenza artificiale. A differenza di molte startup che si basano sui servizi cloud, DeepSeek possiede i suoi data center, che consente un maggiore controllo sull'ottimizzazione del modello AI e l'implementazione più rapida dell'innovazione. L'azienda rimane autofinanziata, migliorando la sua flessibilità e la velocità decisionale.
Immagine: Ensigame.com
DeepSeek attira anche i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle principali università cinesi. L'affermazione della società di formazione Deepseek V3 per soli $ 6 milioni è considerata irrealistica, in quanto rappresenta solo l'utilizzo della GPU durante il pre-allenamento ed esclude altri costi significativi come la ricerca, il perfezionamento del modello, l'elaborazione dei dati e l'infrastruttura complessiva.
Fin dall'inizio, Deepseek ha investito oltre $ 500 milioni in sviluppo dell'IA. La sua struttura snella consente una rapida ed efficace implementazione delle innovazioni di intelligenza artificiale, distinguendola da aziende più grandi e burocratiche.
Immagine: Ensigame.com
Il successo di Deepseek mostra come un'azienda di intelligenza artificiale indipendente ben finanziata può sfidare i leader del settore. Mentre i risultati dell'azienda sono impressionanti, gli esperti suggeriscono che la pretesa di un "bilancio rivoluzionario" per lo sviluppo del modello di intelligenza artificiale è sopravvalutata. I costi di Deepseek, sebbene significativi, sono ancora inferiori a quelli dei suoi concorrenti; Ad esempio, il costo di formazione del modello R1 di DeepSeek era di $ 5 milioni, rispetto ai $ 100 milioni per Chatgpt4o.
Ultimi articoli