De New Chatbot van Deepseek heeft een verrassend capabele AI, uitdagende industriële reuzen en het veroorzaken van aanzienlijke marktrimpels, waaronder een opmerkelijke daling van de aandelenkoers van Nvidia. De introductie ervan: "Hallo, ik ben gemaakt zodat je alles kunt vragen en een antwoord kunt krijgen dat je misschien zelfs zou verrassen", weerspiegelt het concurrentievoordeel nauwkeurig. Dit succes komt voort uit een combinatie van innovatieve architectuur- en trainingsmethoden.
Afbeelding: ensigame.com
Belangrijke technologische vooruitgang omvatten multi-token voorspelling (MTP) , die meerdere woorden tegelijkertijd voorspelt voor verbeterde nauwkeurigheid en efficiëntie; Mengsel van experts (MOE) , met behulp van 256 neurale netwerken (acht geactiveerd per token) in Deepseek V3 voor versnelde training en verbeterde prestaties; en multi-head latente aandacht (MLA) , die herhaaldelijk belangrijke details uithaalt om ervoor te zorgen dat cruciale informatie niet wordt gemist.
Afbeelding: ensigame.com
Terwijl Deepseek aanvankelijk een opmerkelijk lage trainingskosten van $ 6 miljoen claimde voor Deepseek V3 met behulp van 2048 GPU's, onthulde Semianalysis een veel substantiële infrastructuur: ongeveer 50.000 Nvidia Hopper GPU's (inclusief 10.000 H800, 10.000 H100 en aanvullende H20 GPU's) verspreidde zich over meerdere gegevenscentra. Dit vertaalt zich in een serverinvestering van ongeveer $ 1,6 miljard en operationele kosten in de buurt van $ 944 miljoen.
Afbeelding: ensigame.com
Deepseek, een dochteronderneming van High-Flyer, een Chinees hedgefonds, bezit zijn datacenters, bevordert de controle en snelle innovatie. Zijn zelf gefinancierde aard draagt bij aan behendigheid en snelle besluitvorming. Het bedrijf trekt toptalent aan, met sommige onderzoekers die jaarlijks meer dan $ 1,3 miljoen verdienen, voornamelijk van Chinese universiteiten. Het initiële cijfer van $ 6 miljoen weerspiegelt waarschijnlijk alleen pre-training GPU-kosten, exclusief onderzoek, verfijning, gegevensverwerking en algemene infrastructuurkosten. De werkelijke investering van Deepseek in AI -ontwikkeling is groter dan $ 500 miljoen. De compacte structuur zorgt echter voor efficiënte innovatie in vergelijking met grotere, meer bureaucratische concurrenten.
Afbeelding: ensigame.com
Het succes van Deepseek benadrukt het potentieel van goed gefinancierde, onafhankelijke AI-bedrijven om effectief te concurreren. Hoewel de claims van "revolutionaire budget" aantoonbaar overdreven zijn, zijn de prestaties van het bedrijf onmiskenbaar indrukwekkend, vooral in tegenstelling tot de aanzienlijk hogere kosten van concurrenten. De R1 -modelopleiding van Deepseek kost bijvoorbeeld $ 5 miljoen, terwijl chatgpt4o $ 100 miljoen kostte. Het succes van Deepseek is een bewijs van substantiële investeringen, technologische doorbraken en een zeer bekwaam team.