腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?
腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。
搜索
在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。
谷歌最新发现,大模型竟意外对应人脑语言处理机制?!
在 2024 年七月的一篇博客文章中,Meta CEO 马克·扎克伯格表示,“出售访问权限”给 Meta 公开可用的 Llama AI 模型“不是 Meta 的商业模式。”
DeepSeek之后,大模型下半场的走向如何?
当前,传统生物制造方法在知识整合、数据处理和实验设计方面面临诸多挑战,限制了其在工业化应用中的效率和可扩展性。
硅谷投资人Tom Davidson的硬核长文预测,给出了惊人结论:全栈的AI大爆炸,或将率先发生在中国!而当芯片规模扩大1万倍时,AI将逼近物理极限。
我发现对于 o1、R1 等推理模型们大家是又爱又恨,
最近,全球 AI 和机器学习顶会 ICLR 2025 公布了论文录取结果:由蚂蚁数科与清华大学联合团队提出的全新具身协同框架 BodyGen 成功入选 Spotlight(聚光灯/特别关注)论文。
香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架,核心代码全部开源,助力三维生成技术的开放与进步。其中 Craftman3D 获得三个评委一致满分,并被全球多家知名企业如全球最大的多人在线游戏创作平台 Roblox, 腾讯混元 Hunyuan3D-2,XR 实验室的 XR-3DGen 和海外初创公司 CSM 的 3D 创作平台等重量级项目的引用与认可。
万字长文,对多模态LLM中对齐算法进行全面系统性回顾!