Deepseek'in yeni chatbotu, şaşırtıcı derecede yetenekli bir yapay zeka, zorlu endüstri devlerine ve Nvidia'nın hisse senedi fiyatında kayda değer bir düşüş de dahil olmak üzere önemli piyasa dalgalarına neden oluyor. Giriş, "Merhaba, ben yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz", rekabet gücünü doğru bir şekilde yansıtıyor. Bu başarı, yenilikçi mimari ve eğitim metodolojilerinin bir kombinasyonundan kaynaklanmaktadır.
Resim: ensigame.com
Kilit teknolojik gelişmeler arasında, gelişmiş doğruluk ve verimlilik için aynı anda birden fazla kelimeyi öngören çoklu eğimli tahmin (MTP) ; Hızlandırılmış eğitim ve gelişmiş performans için Deepseek V3'te 256 sinir ağı (jeton başına sekiz etkinleştirilmiş) kullanan uzmanların (MOE) karışımı ; ve önemli bilgilerin kaçırılmamasını sağlamak için anahtar ayrıntıları tekrar tekrar çıkaran çok başlı gizli dikkat (MLA) .
Resim: ensigame.com
Deepseek başlangıçta 2048 GPU kullanan Deepseek V3 için oldukça düşük bir eğitim maliyeti iddia ederken, yarı. Çok daha önemli bir altyapı ortaya çıkardı: yaklaşık 50.000 NVIDIA hopper GPU'ları (10.000 H800, 10.000 H100 ve ek H20 GPU'lar dahil) çoklu veri merkezlerine yayıldı. Bu, yaklaşık 1,6 milyar dolarlık bir sunucu yatırımına ve 944 milyon dolara yakın operasyonel giderlere dönüşüyor.
Resim: ensigame.com
Bir Çin Hedge Fonu olan High Flyer'ın bir yan kuruluşu olan Deepseek, veri merkezlerinin sahibi, kontrolü ve hızlı yeniliği teşvik ediyor. Kendini finanse eden doğası çevikliğe ve hızlı karar vermeye katkıda bulunur. Şirket, en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde, öncelikle Çin üniversitelerinden. İlk 6 milyon dolarlık rakam, muhtemelen araştırma, arıtma, veri işleme ve genel altyapı masrafları hariç, GPU öncesi maliyetleri yansıtmaktadır. Deepseek'in AI gelişimine gerçek yatırımı 500 milyon doları aşıyor. Bununla birlikte, kompakt yapısı, daha büyük, daha bürokratik rakiplere kıyasla verimli yeniliklere izin verir.
Resim: ensigame.com
Deepseek'in başarısı, iyi finanse edilen, bağımsız AI şirketlerinin etkili bir şekilde rekabet etme potansiyelini vurgulamaktadır. "Devrimci bütçe" iddiaları tartışmalı olarak abartılı olsa da, şirketin başarıları, özellikle rakiplerin önemli ölçüde daha yüksek maliyetleriyle tezat oluşturduğunda inkar edilemez derecede etkileyici. Örneğin, Deepseek'in R1 model eğitimi 5 milyon dolara mal olurken, chatgpt4o'nun maliyeti 100 milyon dolar. Deepseek'in başarısı, önemli yatırım, teknolojik atılımlar ve yüksek vasıflı bir ekibin bir kanıtıdır.