AI资讯新闻榜单内容搜索-智能体

AlphaGo之父把AI扔进23年的人造社会：智能体3块最硬骨头全在这

从Atari到AlphaGo，从AlphaStar到SIMA，DeepMind用游戏做AI研究已走过十余年，每换一个战场，研究问题就升一个量级。这一次的战场是EVE Online：一个跑了23年、从未重置的活宇宙。

来自主题: AI资讯

10257 点击 2026-05-23 13:48

ICML 2026｜传统UED瓶颈被打破，强化学习也能精准定位「最近发展区」

训练强化学习智能体时，一个常见问题是：有些 level 太简单，智能体跑几遍就会；有些 level 又太难，智能体几乎得不到有效反馈。前者只是在重复已有能力，后者则会把训练预算消耗在无效探索上。真正有价值的训练环境，往往位于二者之间。

来自主题: AI技术研报

9041 点击 2026-05-22 08:45

断供OpenAI！Anthropic收购SDK工具公司Stainless

刚刚，Anthropic买下了SDK工具公司Stainless，从开源MCP到收购Stainless，Anthropic的智能体棋盘已集齐模型、接口、连接三件套。

来自主题: AI资讯

8162 点击 2026-05-21 21:20

来自 Codex 官方团队的分享：如何把 Codex 用到极致

大多数开发者刚接触代码编辑类的 AI 智能体 (AI Agent) 时，通常只让它们干一件事：写代码。比如让它检查一下代码库，生成个差异对比 (diff)，跑跑测试，然后再提个合并请求 (pull request)。

来自主题: AI技术研报

7386 点击 2026-05-21 10:15

腾讯版Claude Design来了：多人实时同屏审设计稿，一键转代码直通IDE

Claude Design前脚刚把设计圈炸完，腾讯又公测了一个Ardot—— AI设计智能体平台，一句话生成可编辑UI设计稿、Figma文件零成本导入、一键转代码直通IDE、多人在线评审……

来自主题: AI资讯

6320 点击 2026-05-20 10:35

HyperEyes：从「搜得更深」到「搜得更宽」，并行多模态搜索智能体的效率革命

现有的开源多模态搜索智能体普遍受困于「裁剪 - 再搜索」的串行处理模式，面对多目标时往往陷入交互冗长、错误级联累积的泥沼。

来自主题: AI技术研报

6087 点击 2026-05-20 09:52

你的AI Agent越用越蠢？港中大、浙大戳破「记忆」的谎言

你是否在使用Agent工作或者写代码时，总感觉上下文不够用？或者感觉反复使用Agent时并没有变得更聪明？感觉目前的记忆方案仍然不够用？今日，香港中文大学联合浙江大学发布的一篇论文关注了这个问题，并引起了学术界广泛讨论：你以为Agent在「记忆」，其实只是在记备忘录。

来自主题: AI技术研报

8859 点击 2026-05-19 15:00

Agent Harness Engineering：Agent的底盘工程综述｜CMU、耶鲁、Amazon

经常切换使用CC、Codex、OpenClaw这类Agent的人会发现：同一个模型，放进不同系统里，表现可能完全不同。

来自主题: AI技术研报

7742 点击 2026-05-19 14:58

多Agent协作反而让模型变蠢，AI也有「旁观者效应」

全行业都在押注多Agent。

来自主题: AI技术研报

10427 点击 2026-05-19 10:02

ICML 2026｜告别「单线程」思维，智能体进化出了原生的并行推理大脑

近年来，大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇总与取舍时，传统的链式思维（Chain-of-Thought）往往就开始「吃力」：容易被早期判断带偏、发散不足、自我纠错弱，而且顺序生成的效率天然受限。

来自主题: AI技术研报

9510 点击 2026-05-19 10:01