Новый чат -бот Deepseek может похвастаться удивительно способным ИИ, бросающим вызов отраслевым гигантам и вызывает значительные рыночные ряды, включая заметное снижение цены акций Nvidia. Его введение: «Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас», точно отражает его конкурентное преимущество. Этот успех проистекает из сочетания инновационных методологий архитектуры и обучения.
Изображение: Ensigame.com
Ключевые технологические достижения включают в себя многократный прогноз (MTP) , который предсказывает несколько слов одновременно для повышения точности и эффективности; Смесь экспертов (MOE) , используя 256 нейронных сетей (восемь активированных на токен) в DeepSeek V3 для ускоренного обучения и улучшения производительности; и мультиголовое скрытое внимание (MLA) , которое неоднократно извлекает ключевые детали, чтобы обеспечить не пропущена важная информация.
Изображение: Ensigame.com
В то время как DeepSeek первоначально потребовал удивительно низкую стоимость обучения в 6 миллионов долларов США для Deepseek V3, используя 2048 графических процессоров, семианализ выявил гораздо более существенную инфраструктуру: приблизительно 50 000 графических процессоров Nvidia Hopper (включая 10 000 H800, 10 000 H100 и дополнительные графические процессоры H20), распространяемые по нескольким центрам данных. Это приводит к инвестициям в сервер примерно в 1,6 млрд. Долл. США, а эксплуатационные расходы около 944 миллионов долларов.
Изображение: Ensigame.com
Deepseek, дочерняя компания High-Flyer, китайского хедж-фонда, владеет своими центрами обработки данных, способствуя контролю и быстрым инновациям. Его самофинансируемая природа способствует ловкости и быстрому принятию решений. Компания привлекает лучших талантов, некоторые исследователи зарабатывают более 1,3 миллиона долларов в год, в основном из китайских университетов. Первоначальная цифра в 6 миллионов долларов, вероятно, отражает только предварительные затраты на графический процессор, исключая исследования, уточнение, обработку данных и общие расходы на инфраструктуру. Фактические инвестиции DeepSeek в развитие ИИ превышают 500 миллионов долларов. Его компактная структура, однако, обеспечивает эффективные инновации по сравнению с более крупными, более бюрократическими конкурентами.
Изображение: Ensigame.com
Успех DeepSeek подчеркивает потенциал хорошо финансируемых, независимых компаний искусственного интеллекта для эффективной конкуренции. В то время как его «революционный бюджет», возможно, преувеличен, достижения компании, несомненно, впечатляют, особенно когда они контрастируют со значительно более высокими затратами конкурентов. Например, обучение DeepSeek R1 модели стоило 5 миллионов долларов, а Chatgpt4o стоит 100 миллионов долларов. Успех DeepSeek является свидетельством существенных инвестиций, технологических прорывов и высококвалифицированной команды.