Jin10 данные 27 июня сообщают, что 27 июня Tencent выпустила и открыла исходный код модели混元-A13B. Как сообщается, это крупная модель на основе архитектуры смешанных экспертов (MoE) с общим количеством параметров 80 миллиардов и активными параметрами 13 миллиардов, которая значительно снижает задержку вывода и вычислительные расходы, при этом обеспечивая результаты на уровне ведущих открытых моделей; в экстремальных условиях достаточно одной низкобюджетной графической карты.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
腾讯 Открытый исходный код混元-A13B模型
Jin10 данные 27 июня сообщают, что 27 июня Tencent выпустила и открыла исходный код модели混元-A13B. Как сообщается, это крупная модель на основе архитектуры смешанных экспертов (MoE) с общим количеством параметров 80 миллиардов и активными параметрами 13 миллиардов, которая значительно снижает задержку вывода и вычислительные расходы, при этом обеспечивая результаты на уровне ведущих открытых моделей; в экстремальных условиях достаточно одной низкобюджетной графической карты.