AI资讯新闻榜单内容搜索-不

4B模型幻觉抑制能力超越GPT-5，CMU等提出行为校准强化学习新方法

大语言模型（LLM）的幻觉问题一直是阻碍其在关键领域部署的核心难题。近日，研究人员提出了一种名为行为校准强化学习（Behaviorally Calibrated Reinforcement Learning）的新方法，通过重新设计奖励函数，让模型学会「知之为知之，不知为不知」。

来自主题: AI技术研报

8613 点击 2026-03-13 10:10

ICLR 2026 | LongHorizonUI：让 GUI 智能体不再"半途而废"——面向长链路任务的统一鲁棒自动化框架

在移动端和桌面端的日常使用中，许多操作并非点一下按钮就能完成。预订一场会议、在游戏商城中购买并装备一件道具、又或者在多个应用之间完成一组连贯的工作流 —— 这些任务通常需要十几步甚至几十步的连续交互。

来自主题: AI技术研报

6426 点击 2026-03-13 09:57

龙虾创始人公开回应腾讯skillhub 抄袭：帮帮忙

X用户SnowShadow爆料，腾讯新上线的AI技能平台SkillHub，将ClawHub上的所有技能数据悉数扒下，导入到了自家平台。斯坦伯格随即亲自下场回应。他透露自己此前曾收到邮件，对方抱怨ClawHub的速率限制导致他们“爬得不够快”.

来自主题: AI资讯

8802 点击 2026-03-12 16:19

320 亿美元！谷歌用史上最大收购，押注「AI+安全」未来

AI 时代，最贵的护城河不是算法，而是安全。

来自主题: AI资讯

7208 点击 2026-03-12 14:53

真·养虾！3步让龙虾边聊边进化，不用GPU不用数据集就能强化学习

让OpenClaw帮干活还不够，现在，程序员们正想方设法让🦞自己变强。

来自主题: AI技术研报

10720 点击 2026-03-12 14:51

编程 Agent 如何重塑工程、产品和设计

软件公司的 EPD（工程 Engineering、产品 Product、设计 Design）存在的意义就是做出好软件。虽然分了不同角色，但最终目标一样：做出能解决业务问题、用户用得上的功能软件。说到底，产出就是代码。这一点必须认清——因为编程 Agent 突然让写代码变得异常简单。那么，EPD 的角色定位会怎么变？

来自主题: AI技术研报

9799 点击 2026-03-12 14:49