Bahay Balita Ang development ng Deepseek AI ay nagkakahalaga ng $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

Ang development ng Deepseek AI ay nagkakahalaga ng $ 1.6 bilyon, ang pag -debunk ng mitolohiya ng kakayahang magamit

May-akda : Simon Update : May 01,2025

Ang bagong chatbot ng Deepseek ay gumawa ng isang makabuluhang epekto sa merkado ng AI, na nagiging sanhi ng isa sa pinakamalaking pagbagsak ng presyo ng stock ng NVIDIA dahil sa mapagkumpitensyang gilid nito. Ipinakilala sa pangako ng pagsagot sa mga katanungan sa mga nakakagulat na paraan, ang Deepseek ay mabilis na nakaposisyon sa sarili bilang isang kakila -kilabot na manlalaro sa industriya.

Pagsubok sa Deepseek Larawan: ensigame.com

Ang nakikilala sa modelo ng Deepseek ay ang makabagong mga pamamaraan ng arkitektura at pagsasanay. Ang kumpanya ay gumagamit ng maraming mga advanced na teknolohiya, kabilang ang:

Multi-Token Prediction (MTP) : Ang pamamaraang ito ay nagbibigay-daan sa modelo upang mahulaan ang maraming mga salita nang sabay-sabay sa pamamagitan ng pagsusuri ng iba't ibang mga bahagi ng isang pangungusap, makabuluhang pagpapabuti ng parehong kawastuhan at kahusayan.

Paghahalo ng mga eksperto (MOE) : Paggamit ng 256 Neural Networks, na may walong na -aktibo para sa bawat gawain sa pagproseso ng token, ang arkitektura na ito ay nagpapabilis sa pagsasanay sa AI at nagpapahusay ng pagganap.

Multi-head latent pansin (MLA) : Ang mekanismong ito ay nakatuon sa pinakamahalagang bahagi ng isang pangungusap, na kumukuha ng mga pangunahing detalye nang maraming beses upang mabawasan ang pagkakataon na nawawala ang mahalagang impormasyon, sa gayon ay nakakakuha ng mga mahahalagang nuances sa data ng pag-input.

Deepseek v3 Larawan: ensigame.com

Ang Deepseek, isang kilalang pagsisimula ng Tsino, ay nagsasabing nakabuo ng isang mapagkumpitensyang modelo ng AI, Deepseek V3, sa kaunting gastos na $ 6 milyon para sa pagsasanay, gamit lamang ang 2048 na mga graphic processors. Gayunpaman, ang mga analyst sa semianalysis ay walang takip na ang kumpanya ay talagang nagpapatakbo ng isang malawak na computational infrastructure, na binubuo ng halos 50,000 NVIDIA HOPPER GPU, kabilang ang 10,000 H800 unit, 10,000 H100s, at karagdagang mga H20 GPU, kumalat sa maraming mga sentro ng data. Ang mga mapagkukunang ito ay ginagamit hindi lamang para sa pagsasanay sa AI kundi pati na rin para sa pananaliksik at pagmomolde sa pananalapi.

Ang kabuuang pamumuhunan sa mga server ng Deepseek ay tinatayang $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na umaabot sa $ 944 milyon. Bilang isang subsidiary ng Chinese Hedge Fund High-flyer, ang Deepseek ay natanggal noong 2023 upang tumuon sa mga teknolohiya ng AI. Hindi tulad ng maraming mga startup na umaasa sa mga serbisyo sa ulap, ang Deepseek ay nagmamay -ari ng mga sentro ng data nito, na nagbibigay -daan para sa higit na kontrol sa pag -optimize ng modelo ng AI at mas mabilis na pagpapatupad ng pagbabago. Ang kumpanya ay nananatiling pondo sa sarili, pagpapahusay ng kakayahang umangkop at bilis ng paggawa ng desisyon.

Deepseek Larawan: ensigame.com

Ang Deepseek ay nakakaakit din ng nangungunang talento, na may ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon, lalo na mula sa nangungunang unibersidad ng Tsino. Ang pag-angkin ng kumpanya ng pagsasanay sa Deepseek V3 sa halagang $ 6 milyon ay itinuturing na hindi makatotohanang, dahil ang account lamang nito para sa paggamit ng GPU sa panahon ng pre-pagsasanay at hindi kasama ang iba pang mga makabuluhang gastos tulad ng pananaliksik, pagpipino ng modelo, pagproseso ng data, at pangkalahatang imprastraktura.

Mula nang magsimula ito, ang Deepseek ay namuhunan ng higit sa $ 500 milyon sa pag -unlad ng AI. Ang sandalan na istraktura nito ay nagbibigay -daan sa mabilis at epektibong pagpapatupad ng mga makabagong AI, na itinatakda ito mula sa mas malaki, mas maraming mga kumpanya ng burukrasya.

Deepseek Larawan: ensigame.com

Ang tagumpay ng Deepseek ay nagpapakita kung paano ang isang mahusay na pondo, independiyenteng kumpanya ng AI ay maaaring hamunin ang mga pinuno ng industriya. Habang ang mga nagawa ng kumpanya ay kahanga -hanga, iminumungkahi ng mga eksperto na ang pag -angkin ng isang "rebolusyonaryong badyet" para sa pag -unlad ng modelo ng AI ay overstated. Ang mga gastos sa Deepseek, habang makabuluhan, ay mas mababa pa kaysa sa mga katunggali nito; Halimbawa, ang gastos sa pagsasanay ng modelo ng R1 ng Deepseek ay $ 5 milyon, kumpara sa $ 100 milyon para sa Chatgpt4O.