Chatbot baru Deepseek mempunyai AI yang berkebolehan, gergasi industri yang mencabar dan menyebabkan riak pasaran yang ketara, termasuk kejatuhan harga saham Nvidia yang ketara. Pengenalannya, "Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda," dengan tepat mencerminkan kelebihan daya saingnya. Kejayaan ini berpunca daripada gabungan metodologi seni bina dan latihan inovatif.
Imej: ensigame.com
Kemajuan teknologi utama termasuk Ramalan Multi-Token (MTP) , yang meramalkan beberapa perkataan secara serentak untuk ketepatan dan kecekapan yang lebih baik; Campuran pakar (MOE) , menggunakan 256 rangkaian saraf (lapan diaktifkan setiap token) dalam DeepSeek V3 untuk latihan dipercepatkan dan prestasi yang lebih baik; dan Perhatian Laten Multi-Head (MLA) , yang berulang kali mengekstrak butiran utama untuk memastikan maklumat penting tidak terlepas.
Imej: ensigame.com
Walaupun DeepSeek pada mulanya mendakwa kos latihan yang sangat rendah sebanyak $ 6 juta untuk DeepSeek V3 menggunakan 2048 GPU, semianalisis mendedahkan infrastruktur yang jauh lebih besar: kira -kira 50,000 GPU NVIDIA Hopper (termasuk 10,000 H800, 10,000 H100, dan tambahan H20 GPU) menyebar di pelbagai pusat data. Ini diterjemahkan kepada pelaburan pelayan kira -kira $ 1.6 bilion dan perbelanjaan operasi berhampiran $ 944 juta.
Imej: ensigame.com
Deepseek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, memupuk kawalan dan inovasi pesat. Sifat yang dibiayai sendiri menyumbang kepada ketangkasan dan membuat keputusan yang cepat. Syarikat itu menarik bakat terbaik, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun, terutamanya dari universiti -universiti China. Angka awal $ 6 juta mungkin hanya mencerminkan kos GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan perbelanjaan infrastruktur keseluruhan. Pelaburan sebenar DeepSeek dalam pembangunan AI melebihi $ 500 juta. Walau bagaimanapun, struktur padatnya membolehkan inovasi yang cekap berbanding dengan pesaing birokrasi yang lebih besar.
Imej: ensigame.com
Kejayaan DeepSeek menyoroti potensi syarikat AI yang dibiayai dengan baik untuk bersaing dengan berkesan. Walaupun tuntutan "belanjawan revolusioner" nya boleh dibesar -besarkan, pencapaian syarikat tidak dapat dinafikan, terutamanya apabila dibandingkan dengan kos pesaing yang jauh lebih tinggi. Sebagai contoh, model latihan R1 DeepSeek berharga $ 5 juta, manakala ChatGPT4O berharga $ 100 juta. Kejayaan DeepSeek adalah bukti pelaburan yang besar, kejayaan teknologi, dan pasukan yang sangat mahir.