Новости Gate: Последние новости криптовалют и цены на криптовалюты

Kimi выпустил новую универсальную аудиофундаментальную модель Kimi-Audio

Jin10 данные 26 апреля, сегодня Kimi выпустила новый открытый исходный код проект — новый универсальный аудиофундаментальный модель Kimi-Audio. Согласно информации, эта модель поддерживает множество задач, включая распознавание речи, понимание аудио, преобразование аудио в текст, голосовые диалоги и другие.

Больше

03:22 GoldenOctober2024

Али Тунг И открытый исходный код аудио-языковой модели Qwen2-Audio, связанный документ был выбран на конференцию ACL 2024

Данные о золоте на 13 августа, модель открытого исходного кода Ali Tongyi, Qwen2-семейство моделей добавляет аудиоязыковую модель Qwen2-Audio. Qwen2-Audio может выполнять голосовой запрос без ввода текста, понимать и анализировать аудиосигналы, включая человеческий голос, естественные звуки, музыку и т. д. Эта модель значительно превосходит предыдущие лучшие модели во многих авторитетных оценках. Команда Tongyi также одновременно выпустила новую аудиомодель оценки Benchmark, связанная статья была включена в текущее международное топ-мероприятие ACL2024.

Больше