Jin10 datos del 27 de junio, el 27 de junio, Tencent publicó y Código abierto el modelo Hunyuan-A13B. Según se informa, como un gran modelo basado en la arquitectura de mezcla de expertos (MoE), tiene un total de 80 mil millones de parámetros y 13 mil millones de parámetros activados, logrando una efectividad comparable a los mejores modelos de código abierto, mientras que reduce drásticamente la latencia de inferencia y el costo computacional; en condiciones extremas, solo se necesita una tarjeta GPU de gama media o baja para su implementación.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Modelo Hunyuan-A13B de código abierto de Tencent
Jin10 datos del 27 de junio, el 27 de junio, Tencent publicó y Código abierto el modelo Hunyuan-A13B. Según se informa, como un gran modelo basado en la arquitectura de mezcla de expertos (MoE), tiene un total de 80 mil millones de parámetros y 13 mil millones de parámetros activados, logrando una efectividad comparable a los mejores modelos de código abierto, mientras que reduce drásticamente la latencia de inferencia y el costo computacional; en condiciones extremas, solo se necesita una tarjeta GPU de gama media o baja para su implementación.