AI资讯新闻榜单内容搜索-Audio

MiniMax创始人闫俊杰：AI正进化为更强的生产力

MiniMax的展台上，主要对外展示的也是MiniMax Agent、海螺AI、MiniMax Audio、星野等AI应用产品，包括智慧家居、穿戴设备、智能座舱、智能音响、智能耳机及交互设备等AI智能硬件产品，以及文旅、电商、办公、教育、游戏、医疗、金融等领域应用。

来自主题: AI资讯

10090 点击 2025-07-29 08:59

AI音效90秒长时可控生成！“狼嚎2秒，蟋蟀鸣8秒”精准搞定！清华&生数科技新研究入选ACM MM 2025

文生音频系统最新突破，实现精确时间控制与90秒长时音频生成！

来自主题: AI资讯

10239 点击 2025-07-23 15:18

最强中文TTS！设计任何音色+情感注入，效果绝了～【附实操】

今天咱们再聊聊TTS（文本转语音）这个话题。4月份给大家分享了MiniMax的TTS平台：MiniMax Audio当时我直呼它是最强中文TTS，那篇反响还不错，主要他们Speech-02-HD的效果确实NB

来自主题: AI资讯

12718 点击 2025-07-11 11:44

Z Potentials｜冷月，00后打造AI语音平台Fish Audio，半年增长500万美元ARR，打造永不背叛AI语音陪伴

从电话录音机到播客，从语音助手到虚拟主播，语音技术在过去几十年里经历了从“工具型服务”向“内容型产品”的演化。大模型的快速崛起让语音技术的发展进入了一个新的跃迁周期，人们对语音产品的期待从听懂”内容“逐渐跃迁到听懂”情绪“。

来自主题: AI资讯

6801 点击 2025-06-05 17:19

音频大模型安全可信度的全面“体检”！6大维度，清华南洋理工联手打造

首个专为ALLMs（音频大语言模型）设计的多维度可信度评估基准来了。

来自主题: AI技术研报

11069 点击 2025-06-03 15:11

速递｜Stability AI联手Arm推出最快手机端免云模型，8秒生成11秒音频

AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型，该公司宣称这是市场上速度最快的模型，且效率高到足以在智能手机上运行。

来自主题: AI资讯

10435 点击 2025-05-15 14:14

ICML25 | 让耳朵「看见」方向！仅依靠360°全景视频，就能生成3D空间音频

空间音频，作为一种能够模拟真实听觉环境的技术，正逐渐成为提升沉浸式体验的关键。

来自主题: AI技术研报

10599 点击 2025-05-15 10:56

秒杀同行！Kimi开源全新音频基础模型，横扫十多项基准测试，总体性能第一

六边形战士来了。

来自主题: AI技术研报

9616 点击 2025-04-26 17:53

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

7B小模型+3.8万条训练数据，就能让音频理解和推断评测基准MMAU榜单王座易主？

来自主题: AI技术研报

4850 点击 2025-03-17 10:52

全球最大开源视频模型，现在也Created in China了，阶跃出品

刚刚，阶跃星辰联合吉利汽车集团，开源了两款多模态大模型！新模型共2款：全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型，其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议，可任意编辑和商业应用。

来自主题: AI资讯

9564 点击 2025-02-18 14:43