Les données de Jinshi du 26 février, Paradigm Quatre (06682.HK) a lancé aujourd'hui la solution tout-en-un de grande modèle d'inférence SageOneIA, réduisant davantage le coût de l'inférence de grand modèle. Par exemple, la version Full Blood de DeepSeekV3/R1 ne nécessite que deux tout-en-un pour fonctionner. De plus, la solution tout-en-un intègre également la technologie intelligente de pooling de Puissance de calcul, prenant en charge les grands modèles de pointe tels que DeepSeekV3/R1, QWen2.5, LLama3.3, etc. Les entreprises peuvent facilement basculer entre la version Full Blood et plusieurs modèles de distillation, avec une augmentation de plus de 30% de l'utilisation GPU et une amélioration moyenne des performances d'inférence de 5 à 10 fois.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
4Paradigm lance SageOne IA, une solution d’appliance d’inférence de grands modèles
Les données de Jinshi du 26 février, Paradigm Quatre (06682.HK) a lancé aujourd'hui la solution tout-en-un de grande modèle d'inférence SageOneIA, réduisant davantage le coût de l'inférence de grand modèle. Par exemple, la version Full Blood de DeepSeekV3/R1 ne nécessite que deux tout-en-un pour fonctionner. De plus, la solution tout-en-un intègre également la technologie intelligente de pooling de Puissance de calcul, prenant en charge les grands modèles de pointe tels que DeepSeekV3/R1, QWen2.5, LLama3.3, etc. Les entreprises peuvent facilement basculer entre la version Full Blood et plusieurs modèles de distillation, avec une augmentation de plus de 30% de l'utilisation GPU et une amélioration moyenne des performances d'inférence de 5 à 10 fois.