Ev Haberler Deepseek AI geliştirme maliyeti 1,6 milyar dolar, karşılanabilirlik mitini ortadan kaldırarak

Deepseek AI geliştirme maliyeti 1,6 milyar dolar, karşılanabilirlik mitini ortadan kaldırarak

Yazar : Simon Güncelleme : May 01,2025

Deepseek'in yeni sohbet botu AI pazarında önemli bir etki yarattı ve NVIDIA'nın rekabet avantajı nedeniyle en büyük hisse senedi fiyat düşüşlerinden birine neden oldu. Soruları şaşırtıcı şekillerde cevaplama vaadiyle tanıtılan Deepseek, kendisini hızla sektörde zorlu bir oyuncu olarak konumlandırdı.

Deepseek Testi Resim: ensigame.com

Deepseek'in modelini ayırt eden şey, yenilikçi mimarisi ve eğitim yöntemleridir. Şirket, aşağıdakiler dahil olmak üzere çeşitli gelişmiş teknolojiler kullanıyor:

Çoklu Tahmini Tahmin (MTP) : Bu yöntem, bir cümlenin farklı bölümlerini analiz ederek hem doğruluğu hem de verimliliği önemli ölçüde artırarak modelin aynı anda birden fazla kelimeyi tahmin etmesini sağlar.

Uzmanların Karışımı (MOE) : Her bir jeton işleme görevi için sekiz etkinleştirilmiş 256 sinir ağı kullanarak, bu mimari AI eğitimini hızlandırır ve performansı artırır.

Çok Baş Gizli Dikkat (MLA) : Bu mekanizma, bir cümlenin en önemli kısımlarına odaklanır ve önemli bilgileri eksik olma şansını azaltmak için önemli ayrıntıları defalarca çıkarır ve böylece giriş verilerindeki önemli nüansları yakalar.

Deepseek V3 Resim: ensigame.com

Önemli bir Çin girişim olan Deepseek, sadece 2048 grafik işlemciyi kullanarak, rekabetçi bir AI modeli olan Deepseek V3 geliştirdiğini iddia ediyor. Bununla birlikte, Semianaliz'deki analistler, şirketin 10.000 H800 birim, 10.000 H100s ve ek H20 GPU'lar dahil olmak üzere yaklaşık 50.000 NVIDIA hunper GPU'ları içeren geniş bir hesaplama altyapısı işlettiğini ortaya çıkardı. Bu kaynaklar sadece AI eğitimi için değil, aynı zamanda araştırma ve finansal modelleme için de kullanılır.

Deepseek tarafından sunuculara yapılan toplam yatırımın 1,6 milyar dolar olduğu tahmin ediliyor ve operasyonel giderler 944 milyon dolara ulaşıyor. Çin Hedge Fonu High-Flyer'ın bir yan kuruluşu olan Deepseek, AI teknolojilerine odaklanmak için 2023'te döndü. Bulut hizmetlerine dayanan birçok girişimin aksine, Deepseek, AI modeli optimizasyonu ve daha hızlı inovasyon uygulaması üzerinde daha fazla kontrol sağlayan veri merkezlerine sahiptir. Şirket, esnekliğini ve karar verme hızını artırarak kendi kendini finanse ediyor.

Deepseek Resim: ensigame.com

Deepseek ayrıca en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde kazanıyor, öncelikle önde gelen Çin üniversitelerinden. Şirketin Deepseek V3'ü sadece 6 milyon dolarlık eğitme iddiası, sadece eğitim öncesi GPU kullanımını açıkladığı ve araştırma, model arıtma, veri işleme ve genel altyapı gibi diğer önemli maliyetleri dışladığı için gerçekçi olmayan olarak kabul edilmektedir.

Başından beri Deepseek, AI gelişimine 500 milyon doların üzerinde yatırım yaptı. Yalın yapısı, AI yeniliklerinin hızlı ve etkili bir şekilde uygulanmasını sağlar ve daha büyük, daha bürokratik şirketlerden ayırır.

Deepseek Resim: ensigame.com

Deepseek'in başarısı, iyi finanse edilen, bağımsız bir AI şirketinin endüstri liderlerine nasıl meydan okuyabileceğini gösteriyor. Şirketin başarıları etkileyici olsa da, uzmanlar AI model gelişimi için "devrimci bir bütçe" iddiasının abartıldığını öne sürüyor. Deepseek'in maliyetleri önemli olsa da, hala rakiplerinden daha düşüktür; Örneğin, Deepseek'in R1 modelinin eğitim maliyeti, ChatGpt4o için 100 milyon dolara kıyasla 5 milyon dolardı.