Deepseek AI Development kostet 1,6 Milliarden US -Dollar und entlarvt den Mythos für Erschwinglichkeit
Deepseeks neuer Chatbot hat einen erheblichen Einfluss auf den KI -Markt hatte und einen der größten Aktienkursabfälle von NVIDIA aufgrund seines wettbewerbsfähigen Randes verursacht. Deepseek wurde mit dem Versprechen eingeführt, Fragen auf überraschende Weise zu beantworten, und hat sich schnell als beeindruckender Akteur in der Branche positioniert.
Bild: Ensigame.com
Was das Modell von Deepseek unterscheidet, sind seine innovativen Architektur- und Trainingsmethoden. Das Unternehmen beschäftigt mehrere fortschrittliche Technologien, darunter:
Multi-Token Prediction (MTP) : Mit dieser Methode kann das Modell mehrere Wörter gleichzeitig vorhergesagt, indem verschiedene Teile eines Satzes analysiert werden, wodurch sowohl die Genauigkeit als auch die Effizienz signifikant verbessert wird.
Mischung von Experten (MOE) : Nutzung von 256 neuronalen Netzwerken, wobei acht für jede Token -Verarbeitungsaufgabe aktiviert ist, beschleunigt diese Architektur das KI -Training und verbessert die Leistung.
Multi-Head Latent Achtung (MLA) : Dieser Mechanismus konzentriert sich auf die wichtigsten Teile eines Satzes und extrahiert mehrmals wichtige Details, um die Wahrscheinlichkeit von wichtigen Informationen zu verringern und damit wichtige Nuancen in den Eingabedaten zu erfassen.
Bild: Ensigame.com
Deepseek, ein prominentes chinesisches Startup, behauptet, ein wettbewerbsfähiges KI -Modell, Deepseek V3, mit minimalen Kosten von 6 Millionen US -Dollar für Schulungen mit nur 2048 Grafikprozessoren entwickelt zu haben. Analysten der semianalysis haben jedoch aufgedeckt, dass das Unternehmen tatsächlich eine riesige Computerinfrastruktur betreibt, die rund 50.000 NVIDIA Hopper -GPUs umfasst, darunter 10.000 H800 -Einheiten, 10.000 H100 und zusätzliche H20 -GPUs, die über mehreren Rechenzentren verteilt sind. Diese Ressourcen werden nicht nur für KI -Schulungen, sondern auch für Forschungs- und Finanzmodellierung verwendet.
Die Gesamtinvestition in Server von Deepseek wird auf 1,6 Milliarden US -Dollar geschätzt, wobei die Betriebskosten 944 Mio. USD betragen. Als Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer wurde Deepseek im Jahr 2023 ausgeschaltet, um sich auf KI-Technologien zu konzentrieren. Im Gegensatz zu vielen Startups, die auf Cloud -Dienste angewiesen sind, besitzt Deepseek seine Rechenzentren, was eine stärkere Kontrolle über AI -Modelloptimierung und eine schnellere Implementierung von Innovationen ermöglicht. Das Unternehmen bleibt selbst finanziert und verbessert seine Flexibilität und Entscheidungsgeschwindigkeit.
Bild: Ensigame.com
Deepseek zieht auch Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen, hauptsächlich von führenden chinesischen Universitäten. Die Behauptung des Unternehmens, Deepseek V3 für nur 6 Millionen US-Dollar auszubilden, gilt als unrealistisch, da es nur die GPU-Nutzung während der Vorausbildung ausmacht und andere bedeutende Kosten wie Forschung, Modellverfeinerung, Datenverarbeitung und Gesamtinfrastruktur ausschließt.
Seit seinem Start hat Deepseek über 500 Millionen US -Dollar in die KI -Entwicklung investiert. Die magere Struktur ermöglicht eine schnelle und effektive Implementierung von KI -Innovationen und unterscheidet sie von größeren, bürokratischeren Unternehmen.
Bild: Ensigame.com
Der Erfolg von Deepseek zeigt, wie ein gut finanziertes, unabhängiges KI-Unternehmen Branchenführer herausfordern kann. Während die Leistungen des Unternehmens beeindruckend sind, schlagen Experten vor, dass die Behauptung eines "revolutionären Budgets" für die Entwicklung der KI -Modellentwicklung überbewertet ist. Die Kosten von Deepseek sind zwar erheblich, aber immer noch niedriger als die seiner Konkurrenten. Zum Beispiel betrugen die Trainingskosten für das R1 -Modell von Deepseek 5 Millionen US -Dollar, verglichen mit 100 Millionen US -Dollar für ChatGPT4O.