4Paradigm lance SageOne IA, une solution d’appliance d’inférence de grands modèles

robot
Création du résumé en cours

Les données de Jinshi du 26 février, Paradigm Quatre (06682.HK) a lancé aujourd'hui la solution tout-en-un de grande modèle d'inférence SageOneIA, réduisant davantage le coût de l'inférence de grand modèle. Par exemple, la version Full Blood de DeepSeekV3/R1 ne nécessite que deux tout-en-un pour fonctionner. De plus, la solution tout-en-un intègre également la technologie intelligente de pooling de Puissance de calcul, prenant en charge les grands modèles de pointe tels que DeepSeekV3/R1, QWen2.5, LLama3.3, etc. Les entreprises peuvent facilement basculer entre la version Full Blood et plusieurs modèles de distillation, avec une augmentation de plus de 30% de l'utilisation GPU et une amélioration moyenne des performances d'inférence de 5 à 10 fois.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)