AI资讯新闻榜单内容搜索-大模

独家｜ChatGPT核心贡献者姜旭归国创业：把LLM的Scaling带到具身智能

姜旭是少数完整参与过 OpenAI 大模型核心技术演进的华人创业者之一。2019 至 2023 年间，他经历了 GPT 系列能力爆发最关键的阶段，工作横跨底层训练 infra、大规模预训练、RLHF 对齐算法与数据构建等核心链路。

来自主题: AI资讯

10707 点击 2026-05-22 10:26

一个做国产 GPU 的公司，在前几天的发布会上，一口气更新了好几款端侧产品，有家庭智能中枢、AI PC、Agent，还有具身智能相关的工作。它叫 MTT AICUBE，按官方说法是「一台面向家庭的 AI 智算中枢」。

来自主题: AI资讯

9125 点击 2026-05-22 09:56

中科大团队首先推出动态多模态知识注入基准MMEVOKE，解构遗忘机制，并在此基础上提出全新双阶段框架KORE。通过「知识树」自动增强与「零空间」协方差约束微调，为大模型终身学习开辟了全新路径。

来自主题: AI技术研报

10052 点击 2026-05-22 09:28

你猜一个能翻译33种语言、性能逼近顶尖闭源模型的AI，装进手机里需要多大？

来自主题: AI资讯

6558 点击 2026-05-22 09:28

随着 o1/R1 等推理模型的发展 [1][2]，「让模型多想一会儿」几乎成了提升复杂推理能力的标准方案。更长的 Chain-of-Thought、更大的测试时计算、更深的内部推理，都在用更多计算换取更可靠的答案。

来自主题: AI技术研报

8243 点击 2026-05-22 08:44

让 AI 来管理代码的话，每次读 500 行反而比读 1000 行更费 Token，而且人工编排流程真不如让大模型自己定，「很多的事儿，还是很反直觉的」

来自主题: AI资讯

9309 点击 2026-05-21 10:14

仅仅一个月后，阿里又带着最强旗舰模型杀回来了！今天上午，在 2026 阿里云峰会上，阿里全新一代千问旗舰模型 Qwen3.7-Max 登场了！在 Arena 公布的最新一期全球大模型盲测总榜中，Qwen3.7-Max 总成绩位列国产模型第一：傲视一众国产大模型

来自主题: AI资讯

10162 点击 2026-05-20 16:26

大模型的能力边界正在不断拓展，从文字到视觉，再到音频，全模态理解已渐成现实。然而，当你问一个多模态大模型「这首歌的高潮从第几秒开始？」或者「第 30 秒之后乐器编配发生了什么变化？」，得到的往往是一个模糊甚至错误的回答。

来自主题: AI技术研报

6798 点击 2026-05-20 09:51

过去一段时间，很多人对大模型都有一个明显感受：token 总是不够用。

来自主题: AI技术研报

7527 点击 2026-05-19 15:32

伯克利等发布FST框架：通过快慢分层解决大模型持续学习死局。

来自主题: AI技术研报

8366 点击 2026-05-19 15:31