Обновление DeepSeek V3 вводит новую парадигму искусственного интеллекта: совместное развитие вычислительной мощности и алгоритма ведет к изменениям в отрасли.

Обновление DeepSeek V3 приводит к новой парадигме AI: Синергия вычислительной мощности и алгоритмов

Недавно DeepSeek выпустил обновление последней версии V3 на Hugging Face — DeepSeek-V3-0324, параметры модели достигли 685 миллиардов, были значительно улучшены кодовые возможности, дизайн пользовательского интерфейса и способности к выводу.

На недавно завершившейся конференции GTC 2025 Хуан Жэньсюнь высоко оценил DeepSeek. Он подчеркнул, что ранее рынок ошибочно полагал, что эффективная модель DeepSeek снизит спрос на чипы; на самом деле в будущем потребность в вычислениях будет только расти, а не уменьшаться.

DeepSeek как представитель прорывного алгоритма вызвал размышления о роли вычислительной мощности и алгоритма в развитии отрасли, в связи с отношениями между поставками чипов.

От вычислительной мощности к алгоритмическим инновациям: Новый парадигма AI под руководством DeepSeek

Вычислительная мощность и эволюция алгоритмов в симбиозе

В области ИИ повышение вычислительной мощности создает основу для запуска более сложных алгоритмов, позволяя моделям обрабатывать большие объемы данных и изучать более сложные паттерны; оптимизация алгоритмов, в свою очередь, может более эффективно использовать вычислительную мощность, повышая эффективность использования вычислительных ресурсов.

Вычислительная мощность и алгоритм имеют симбиотические отношения, которые заново формируют ландшафт индустрии ИИ:

  1. Дифференциация технических направлений: некоторые компании стремятся создать супербольшие вычислительные мощности, в то время как другие сосредотачиваются на оптимизации алгоритмов, формируя разные технические школы.

  2. Перестройка цепочки поставок: одна компания по производству чипов стала лидером в области вычислительной мощности ИИ благодаря своей экосистеме, в то время как облачные сервисы снизили порог входа с помощью эластичных вычислительных мощностей.

  3. Корректировка распределения ресурсов: компании ищут баланс между инвестициями в аппаратную инфраструктуру и разработкой эффективных алгоритмов.

  4. Восхождение открытых сообществ: такие открытые модели, как DeepSeek и LLaMA, позволяют делиться результатами инноваций в алгоритмах и вычислительной мощности, ускоряя итерацию и распространение технологий.

Технические инновации DeepSeek

Быстрый рост DeepSeek неразрывно связан с его технологическими инновациями. Ниже представлено краткое объяснение его основных инновационных особенностей:

Оптимизация архитектуры модели

DeepSeek использует комбинацию архитектуры Transformer + MOE (Смешанная группа экспертов) и вводит механизм многоголового латентного внимания (Multi-Head Latent Attention, MLA). Эта архитектура напоминает эффективную команду, где Transformer обрабатывает обычные задачи, а MOE действует как группа экспертов, вызывая наиболее подходящего эксперта для конкретной проблемы. Механизм MLA позволяет модели более гибко сосредотачиваться на различных важных деталях, что дополнительно повышает производительность.

Инновации в методах обучения

DeepSeek предложила рамки смешанной точности FP8 для обучения. Эта рамка может динамически выбирать подходящую вычислительную мощность в зависимости от требований различных этапов обучения. Используйте более высокую точность, когда требуется высокая точность вычислений, и снижайте точность, когда приемлема более низкая точность, тем самым оптимизируя использование ресурсов, увеличивая скорость обучения и уменьшая использование памяти.

Повышение эффективности вывода

На этапе вывода DeepSeek внедрил технологию многотокенового предсказания (Multi-token Prediction, MTP). В отличие от традиционного пошагового предсказания, технология MTP позволяет предсказывать несколько токенов одновременно, что значительно увеличивает скорость вывода и снижает затраты на вывод.

Прорыв в алгоритме强化学习

Новый алгоритм глубокого обучения DeepSeek GRPO (Обобщенная оптимизация с учетом вознаграждений и штрафов) оптимизировал процесс обучения модели. Этот алгоритм позволяет уменьшить ненужные вычисления при гарантированном повышении производительности модели, достигая баланса между производительностью и стоимостью.

Эти инновации сформировали целостную технологическую систему, снижая требования к вычислительной мощности на всем протяжении цепочки от обучения до вывода. Обычные потребительские видеокарты теперь могут запускать мощные AI-модели, что значительно снизило порог входа в AI-приложения и позволило большему числу разработчиков и предприятий участвовать в AI-innovations.

Влияние на чиповую индустрию

DeepSeek на самом деле выполняет оптимизацию алгоритма через уровень PTX (Parallel Thread Execution) от одной из компаний по производству чипов. PTX является промежуточным языком представления, находящимся между высокоуровневым кодом и фактическими инструкциями GPU, позволяя DeepSeek осуществлять более тонкую настройку производительности.

Влияние на индустрию чипов двустороннее. С одной стороны, DeepSeek более тесно связан с аппаратным обеспечением и сопутствующей экосистемой, снижение барьеров для применения ИИ может расширить общий рынок; с другой стороны, оптимизация алгоритмов DeepSeek может изменить структуру спроса на высококачественные чипы, и некоторые модели ИИ, которые ранее могли работать только на высококачественных GPU, теперь могут эффективно функционировать на средних и даже потребительских видеокартах.

Значение для китайской индустрии ИИ

Оптимизация алгоритма DeepSeek предоставляет путь технологического прорыва для китайской AI-индустрии. В условиях ограничений на высококачественные чипы подход "программное обеспечение вместо аппаратного обеспечения" снизил зависимость от импортных чипов высшего класса.

На upstream высокоэффективный алгоритм снизил давление на需求 вычислительной мощности, что позволяет провайдерам вычислительных услуг продлить срок службы оборудования за счет программной оптимизации и повысить доходность инвестиций. На downstream оптимизированные открытые модели снизили порог входа для разработки приложений ИИ. Множество малых и средних предприятий могут разрабатывать конкурентоспособные приложения на основе модели DeepSeek, не требуя большого количества ресурсов вычислительной мощности, что приведет к появлению большего количества решений ИИ в вертикальных областях.

Глубокое влияние на Web3+AI

Децентрализованная AI инфраструктура

Оптимизация алгоритма DeepSeek обеспечивает новую动力 для инфраструктуры Web3 AI. Инновационная архитектура, эффективные алгоритмы и низкие требования к вычислительной мощности делают возможным децентрализованное AI-вычисление. Архитектура MoE естественным образом подходит для распределенного развертывания, разные узлы могут иметь разные сети экспертов, без необходимости хранения полной модели на одном узле, что значительно снижает требования к хранению и вычислениям на одном узле, тем самым повышая гибкость и эффективность модели.

FP8 тренировочная рамка далее снизила требования к высокопроизводительным вычислительным ресурсам, что позволило большему количеству вычислительных ресурсов присоединиться к сети узлов. Это не только снизило барьер для участия в децентрализованных AI вычислениях, но и повысило вычислительную способность и эффективность всей сети.

Многослойные интеллектуальные системы

  1. Оптимизация интеллектуальных торговых стратегий: с помощью анализа данных рынка в реальном времени, прогнозирования краткосрочных колебаний цен, выполнения сделок в блокчейне, мониторинга результатов сделок и других совместных операций нескольких агентов, помочь пользователям получить более высокую прибыль.

  2. Автоматическое выполнение смарт-контрактов: совместная работа агентов, таких как мониторинг смарт-контрактов, выполнение и контроль результатов, для реализации более сложной автоматизации бизнес-логики.

  3. Персонализированное управление инвестиционным портфелем: ИИ помогает пользователям в реальном времени находить лучшие возможности для стейкинга или предоставления ликвидности в зависимости от их склонности к риску, инвестиционных целей и финансового состояния.

DeepSeek именно в условиях ограничения вычислительной мощности, через инновации в алгоритмах ищет прорывы, открывая для китайской AI-индустрии дифференцированный путь развития. Снижение порога применения, содействие интеграции Web3 и AI, уменьшение зависимости от высококлассных чипов, усиление финансовых инноваций — эти влияния пересматривают ландшафт цифровой экономики. Будущее развития AI больше не будет просто соревнованием вычислительной мощности, а станет соревнованием по совместной оптимизации вычислительной мощности и алгоритмов. На этой новой трассе инноваторы, такие как DeepSeek, переопределяют правила игры с помощью китайской мудрости.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Поделиться
комментарий
0/400
ApeWithAPlanvip
· 26м назад
囤卡未雨 Сегодня вечером видеокарты продолжат рост
Посмотреть ОригиналОтветить0
WhaleWatchervip
· 8ч назад
6850 миллиардов параметров - вот что называется большой моделью!!
Посмотреть ОригиналОтветить0
RektButAlivevip
· 8ч назад
Чувствую, что скоро будут играть для лохов.
Посмотреть ОригиналОтветить0
MemecoinTradervip
· 8ч назад
только что развернул боты настроения на $nvda... смотрите, как этот нарратив будет пампиться жестко
Посмотреть ОригиналОтветить0
StablecoinAnxietyvip
· 8ч назад
Какое отношение это имеет к luna?
Посмотреть ОригиналОтветить0
  • Закрепить