帮普通人「驯服」Agent,这支硅谷初创团队冲上了X全球热搜
帮普通人「驯服」Agent,这支硅谷初创团队冲上了X全球热搜「用一句话交代任务,然后什么都不用管,AI 自动执行。」这或许是大家最初对「AI 超级助手」的想象。
搜索
「用一句话交代任务,然后什么都不用管,AI 自动执行。」这或许是大家最初对「AI 超级助手」的想象。
Anthropic推出平台级产品:Claude Managed Agents,开发周期从数月压缩到几天,To B业务更进一步,这是直接给了一个Harness Agent的盒子,用户只管干活就行了,随着产品发布,A厂还发布了一篇Harness(Managed Agents)工程细节文章,感觉A厂就差说在座的都是xx了,再一次遥遥领先!我们一文来说清楚
LangChain 只换了模型外面的基础设施——同一个模型、同一套权重——就从 TerminalBench 2.0 排行榜 30 名开外直接跳到了第 5 名。另一个独立研究项目让大模型自己优化这层基础设施,达到了 76.4% 的通过率,超过了所有人工设计的方案。
2026 年 3 月 30 日,#CreaoAI 冲上 X 全球热搜 Top 3。我们刷到这条热搜的时候,第一反应是:这次的用户反应有点不一样。不是常见的"AI新闻"传播路径——科技媒体报道、KOL转发、然后消失。这次的评论区里,不同语种的用户开始自己动手,有人让它每周一给 Gmail 邮箱里发送实时报价报告,
Harness 应由业务驱动。
由Liu Fayao(刘发耀,新加坡A*STAR研究科学家),Ye Deheng(叶德珩,前腾讯AI合伙人&首席专家)和Chen Tianrun(陈天润,魔芯科技创始人)带领的研究团队提出了Claw AI Lab。
产品本身包括了一个Agentic Payment Skill,一个龙虾可以用的“虚拟卡包”,和一套他的围栏,(好像现在可以叫 Harness 了)。这些东西本身只是配套的 infra,核心在于商户的功能 Skill,服务于 Agent 的需求。商户会在 Skill 中引导用户授权 Agent,允许自主完成小额的支付。
Harness(驾驭)的风,终究还是从大模型,吹到了机器人!
在 AI 圈,模型至上论正在遭遇前所未有的挑战。当所有人都在屏息等待新模型再次刷新智力天花板时,AI 基础设施领军人物、LangChain 联合创始人 Harrison Chase 在最新对话中抛出了新预判:大模型正在沦为大宗商品,而决定 Agent 成败的,是那个包裹在模型外的 Harness 。
去年讨论Agent落地时,重点往往是Context Engineering。大家都在琢磨怎么放 Few-shot,怎么优化 RAG 检索的文本片段。但随着 Agent 任务复杂度的上升,控制数据流向、工具调度和异常处理的底层脚手架代码,往往比单纯拼接文本对系统性能的影响更大。