A guerra de preços dos grandes modelos se intensifica, o Tongyi Qianwen reduz o preço novamente
Recentemente, a Alibaba Cloud anunciou uma redução significativa nos preços das chamadas API para o modelo de comercialização e o modelo de código aberto Tongyi Qianwen. Dentre eles, o preço de entrada do modelo principal Qwen-Long, de nível GPT-4, caiu de 0,02 yuan/k tokens para 0,5 yuan/milhões de tokens, uma redução de até 97%.
Anteriormente, a Alibaba Tongyi lançou o modelo open source Qwen1.5-110B com uma escala de parâmetros de 1100 milhões. Este modelo teve um desempenho excepcional em várias avaliações de referência, superando modelos semelhantes com uma escala de 70 milhões de parâmetros. No ranking de grandes modelos open source da HuggingFace, o Qwen1.5-110B conquistou o primeiro lugar.
A estratégia combinada de "redução de preços + código aberto" está se tornando um consenso entre os fabricantes de grandes modelos globais. Essa abordagem ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o preço elevado das APIs de grandes modelos e a qualidade insatisfatória dos modelos de código aberto. Reduzir a barreira de entrada irá impulsionar a ampla implementação de aplicações de IA.
Na verdade, o Tongyi Qianwen não é o primeiro grande modelo a adotar uma estratégia de redução de preços. Desde maio, vários produtos de grandes modelos lançaram sucessivamente planos de preços baixos ou anunciaram reduções de preços:
A DeepSeek, subsidiária da Huanfang Quantization, lançou um modelo MoE de segunda geração de código aberto, com preços de API que representam apenas uma fração de um conhecido grande modelo.
A Zhiyu AI reduziu o preço de chamada do produto modelo GLM-3Turbo versão pessoal de 5 yuan/ milhão de tokens para 1 yuan/ milhão de tokens.
Uma conhecida empresa de IA lançou um novo modelo, com desempenho equivalente à versão flagship, mas com o preço reduzido pela metade e velocidade de chamada aumentada em dobro.
O preço de entrada da inferência do modelo principal do Doubao é apenas 0.0008 euros/k Tokens.
A Baidu Smart Cloud anunciou que os dois principais modelos do seu modelo Wenxin estão totalmente gratuitos.
A iFlytek anunciou que a API iFlytek Spark Lite estará permanentemente aberta e gratuita.
A guerra de preços das APIs de grandes modelos está a intensificar-se, muito provavelmente devido ao avanço da tecnologia de inferência e à diminuição dos custos. Isso não só oferece mais opções aos desenvolvedores, como também impulsionará o florescimento das aplicações de IA.
Além da redução de preços, a Alibaba Tongyi também lançou vários modelos em diferentes escalas para atender às necessidades de diferentes cenários. Oito grandes modelos de linguagem, variando de 500 milhões a 110 bilhões de parâmetros, cobrem uma variedade de cenários de aplicação, desde dispositivos móveis até nível empresarial. Além disso, a Tongyi também abriu o código de modelos multimodais, como compreensão visual, compreensão de áudio e geração de código, oferecendo suporte abrangente para os desenvolvedores.
De um modo geral, os fornecedores de grandes modelos estão a pavimentar o caminho para o desenvolvimento de aplicações de IA através de uma abordagem dupla de redução de preços e de código aberto. Com o contínuo avanço da tecnologia e a diminuição constante dos custos, temos motivos para esperar que as aplicações de IA floresçam em mais áreas.
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
20 gostos
Recompensa
20
9
Partilhar
Comentar
0/400
DegenDreamer
· 23h atrás
A guerra de preços finalmente começou.
Ver originalResponder0
MevTears
· 07-12 02:30
Após a redução de preço, a barreira de entrada ficou mais baixa.
A guerra de preços intensifica-se, a taxa de chamada da API Tongyi Qianwen desce 97% novamente.
A guerra de preços dos grandes modelos se intensifica, o Tongyi Qianwen reduz o preço novamente
Recentemente, a Alibaba Cloud anunciou uma redução significativa nos preços das chamadas API para o modelo de comercialização e o modelo de código aberto Tongyi Qianwen. Dentre eles, o preço de entrada do modelo principal Qwen-Long, de nível GPT-4, caiu de 0,02 yuan/k tokens para 0,5 yuan/milhões de tokens, uma redução de até 97%.
Anteriormente, a Alibaba Tongyi lançou o modelo open source Qwen1.5-110B com uma escala de parâmetros de 1100 milhões. Este modelo teve um desempenho excepcional em várias avaliações de referência, superando modelos semelhantes com uma escala de 70 milhões de parâmetros. No ranking de grandes modelos open source da HuggingFace, o Qwen1.5-110B conquistou o primeiro lugar.
A estratégia combinada de "redução de preços + código aberto" está se tornando um consenso entre os fabricantes de grandes modelos globais. Essa abordagem ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o preço elevado das APIs de grandes modelos e a qualidade insatisfatória dos modelos de código aberto. Reduzir a barreira de entrada irá impulsionar a ampla implementação de aplicações de IA.
Na verdade, o Tongyi Qianwen não é o primeiro grande modelo a adotar uma estratégia de redução de preços. Desde maio, vários produtos de grandes modelos lançaram sucessivamente planos de preços baixos ou anunciaram reduções de preços:
A DeepSeek, subsidiária da Huanfang Quantization, lançou um modelo MoE de segunda geração de código aberto, com preços de API que representam apenas uma fração de um conhecido grande modelo.
A Zhiyu AI reduziu o preço de chamada do produto modelo GLM-3Turbo versão pessoal de 5 yuan/ milhão de tokens para 1 yuan/ milhão de tokens.
Uma conhecida empresa de IA lançou um novo modelo, com desempenho equivalente à versão flagship, mas com o preço reduzido pela metade e velocidade de chamada aumentada em dobro.
O preço de entrada da inferência do modelo principal do Doubao é apenas 0.0008 euros/k Tokens.
A Baidu Smart Cloud anunciou que os dois principais modelos do seu modelo Wenxin estão totalmente gratuitos.
A iFlytek anunciou que a API iFlytek Spark Lite estará permanentemente aberta e gratuita.
A guerra de preços das APIs de grandes modelos está a intensificar-se, muito provavelmente devido ao avanço da tecnologia de inferência e à diminuição dos custos. Isso não só oferece mais opções aos desenvolvedores, como também impulsionará o florescimento das aplicações de IA.
Além da redução de preços, a Alibaba Tongyi também lançou vários modelos em diferentes escalas para atender às necessidades de diferentes cenários. Oito grandes modelos de linguagem, variando de 500 milhões a 110 bilhões de parâmetros, cobrem uma variedade de cenários de aplicação, desde dispositivos móveis até nível empresarial. Além disso, a Tongyi também abriu o código de modelos multimodais, como compreensão visual, compreensão de áudio e geração de código, oferecendo suporte abrangente para os desenvolvedores.
De um modo geral, os fornecedores de grandes modelos estão a pavimentar o caminho para o desenvolvimento de aplicações de IA através de uma abordagem dupla de redução de preços e de código aberto. Com o contínuo avanço da tecnologia e a diminuição constante dos custos, temos motivos para esperar que as aplicações de IA floresçam em mais áreas.