AI资讯新闻榜单内容搜索-智能体

BudgetMem：给Runtime Agent Memory装上「预算路由器」，让记忆系统学会按需分配运行成本

当 LLM Agent 处理长期对话、多轮交互和复杂文档时，Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文，并支撑跨时间的推理能力。

来自主题: AI技术研报

8540 点击 2026-06-15 09:20

平替版Fable 5的打开教程来了：性能追平，成本砍半

最新测试显示，模型抱团后实力明显升级：Opus 4.8+GPT-5.5>Fable 5；Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash=Fable 5。能力追上了，开销还减半。根据官方定价，相比Fable 5，Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash这套平价阵容，成本降幅接近80%。

来自主题: AI资讯

9543 点击 2026-06-14 16:04

“智能体最后的考试”，Fable 5竟然不敌GPT 5.5

刚刚，UC伯克利放出了一场号称“智能体最后的考试”的全新基准测试。它把当今最强的AI Agent们拉到考场上，让它们干真正的活——在Siemens NX里建3D模型、在Unreal Engine里搭游戏场景、在Adobe After Effects里做特效合成。

来自主题: AI技术研报

9113 点击 2026-06-13 10:41

速递｜xAI前联合创始人创办River AI，押注个性化AI Agent赛道

来自埃隆·马斯克旗下 xAI 的一批前员工组建了一家专注于个性化人工智能的新初创公司，这或许是近期 xAI 离职潮中最为引人注目的新项目。他于周三宣布成立 River AI。巴布什金表示，这家初创公司还包括前 xAI 和特斯拉公司的员工，旨在开发能够向用户学习并由用户控制的人工智能代理。

来自主题: AI资讯

7925 点击 2026-06-12 10:52

AI智能体走出实验室！中科院等机构联合发布首个OpenClaw系统性综述

上下文攻击、供应链渗透、AI社区崩溃……当大模型智能体真正进入开放世界，挑战远比想象中复杂。

来自主题: AI技术研报

7556 点击 2026-06-12 10:14

Agent 带来Episodic Workload后，传统开源数据库已经远不够用了

如果把一个商业化产品、一个科技公司的底层系统比作一棵树，那任意挑出一个项目，层层抽丝剥茧之后，你一定会发现，最早的年轮，一定与开源有关。

来自主题: AI技术研报

7194 点击 2026-06-12 10:13

Anthropic宣告「递归自我提升」时代到来，LLM如何实现自我进化？全景综述带你一探究竟

近日，Anthropic 发布了一篇引发广泛关注的文章《When AI builds itself》。文中披露了极其惊人的内部数据：截至 2026 年 5 月，Anthropic 超过 80% 的合并代码已由 Claude 编写，工程师的日常代码产出飙升了 8 倍；更令人瞩目的是，AI 智能体已经可以自主提出假设、执行长达数百小时的强化安全实验。

来自主题: AI技术研报

10519 点击 2026-06-12 10:13

斩获15个顶级零日漏洞：0G Lab联合新国立，北大和北邮团队构建的共识协议debug智能体框架

分布式系统的 “圣杯”—— 共识协议（Consensus Protocols），长久以来都是顶级基础设施工程师的 “Bug 地狱”。由于其状态极其复杂、多节点交织，传统测试和单体 LLM 对硬核的 Deep Bug（深层逻辑漏洞）几乎束手无策。

来自主题: AI技术研报

8311 点击 2026-06-11 14:59

ACL 2026 Oral｜语义推理如鲠在喉：大模型被「短语」难住了

AI 的能力边界正在不断被刷新。从数学推理到代码生成，再到数字化白领，语言模型和语言智能体在诸多基准测试中已展现出超越人类专家的表现。一个看似顺理成章的判断早已成为共识：语言模型已经具备了扎实的语言理解和语义推理能力。然而，ACL 2026 Oral 的一项研究工作从一个更基础的层面重新审视了这个问题：语言模型真的理解（短语）语义吗？

来自主题: AI技术研报

9092 点击 2026-06-11 14:32

独家｜让AI接手真实操作，字节系团队、GUI Agent平台Core-Mate获数千万元融资

独家获悉，GUI Agent（图形用户界面智能体）执行平台「Core-Mate」近日宣布完成数千万人民币融资。核心团队主要来自字节跳动，成员在用户产品、业务增长和商业化落地中积累了系统经验。在团队看来，下一代 AI 产品的关键不只在模型能力，也在入口、场景和用户行为。

来自主题: AI资讯

9565 点击 2026-06-11 11:46