腾讯混元大模型负责人王迪:揭秘万亿 MoE 系统工程之道|智者访谈
腾讯混元大模型负责人王迪:揭秘万亿 MoE 系统工程之道|智者访谈人工智能正经历一场由大模型引发的革命。这些拥有数十亿甚至万亿参数的庞然大物,正在重塑我们对 AI 能力的认知,也构筑起充满挑战与机遇的技术迷宫——从计算集群高速互联网络的搭建,到训练过程中模型稳定性和鲁棒性的提升,再到探索更快更优的压缩与加速方法,每一步都是对创新者的考验。
搜索
人工智能正经历一场由大模型引发的革命。这些拥有数十亿甚至万亿参数的庞然大物,正在重塑我们对 AI 能力的认知,也构筑起充满挑战与机遇的技术迷宫——从计算集群高速互联网络的搭建,到训练过程中模型稳定性和鲁棒性的提升,再到探索更快更优的压缩与加速方法,每一步都是对创新者的考验。
宇树是一家非常“土”,到了极致却又变得非常酷的公司。
从 rabbit r1、AI Pin 再到现在蜂拥而上的 AI 眼镜、项链和儿童玩偶,AI 大模型再次掀起了一股智能硬件的创业浪潮。每个人都在为一个「AI 时代的新 iPhone」的头衔,而努力向前。但是,硬件创业路何其艰难?我们或许可以回过头,看看在移动互联网兴起之时,Apple Watch 的鼻祖——Fitbit 是如何从零到一,打造出一个智能手环市场和品牌的?
过去十几年来,科技巨头之间发生了前所未有的激烈竞赛,囤积算力、笼络人才,还要小心翼翼地看护好自己的护城河,大家都希望能锻造出最好的 AI 模型,获得进入 AGI 时代的门票
本期我们邀请到了 纽约大学计算机科学院博士 童晟邦 带来【多模态大模型:视觉为中心的探索】的主题分享。
Top 5%的人才争夺战。
2024年,落地,无疑是大模型最重要的主题。
双雄理念之争,超越OpenAI,「xAI」不止是AI。
虽然大语言模型(LLM)的能力不断突破,但在长文生成方面却一直存在瓶颈。近日,清华大学和智谱AI联合发布的最新研究成果,为解决这一难题提供了创新方案。这项名为"LongWriter"的技术,成功将AI模型的长文生成能力从约2000字提升至10000字以上,同时保持了高质量输出。这一成果通过创新的数据构建方法、模型训练策略和评估基准,为AI长文创作开辟了新天地。
现在,最强数学大模型,人人都可上手玩了!