AI资讯新闻榜单内容搜索-不

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 不
4B模型幻觉抑制能力超越GPT-5,CMU等提出行为校准强化学习新方法

4B模型幻觉抑制能力超越GPT-5,CMU等提出行为校准强化学习新方法

4B模型幻觉抑制能力超越GPT-5,CMU等提出行为校准强化学习新方法

大语言模型(LLM)的幻觉问题一直是阻碍其在关键领域部署的核心难题。近日,研究人员提出了一种名为行为校准强化学习(Behaviorally Calibrated Reinforcement Learning)的新方法,通过重新设计奖励函数,让模型学会「知之为知之,不知为不知」。

来自主题: AI技术研报
8613 点击    2026-03-13 10:10
ICLR 2026 | LongHorizonUI:让 GUI 智能体不再"半途而废"——面向长链路任务的统一鲁棒自动化框架

ICLR 2026 | LongHorizonUI:让 GUI 智能体不再"半途而废"——面向长链路任务的统一鲁棒自动化框架

ICLR 2026 | LongHorizonUI:让 GUI 智能体不再"半途而废"——面向长链路任务的统一鲁棒自动化框架

在移动端和桌面端的日常使用中,许多操作并非点一下按钮就能完成。预订一场会议、在游戏商城中购买并装备一件道具、又或者在多个应用之间完成一组连贯的工作流 —— 这些任务通常需要十几步甚至几十步的连续交互。

来自主题: AI技术研报
6426 点击    2026-03-13 09:57
龙虾创始人公开回应腾讯skillhub 抄袭:帮帮忙

龙虾创始人公开回应腾讯skillhub 抄袭:帮帮忙

龙虾创始人公开回应腾讯skillhub 抄袭:帮帮忙

X用户SnowShadow爆料,腾讯新上线的AI技能平台SkillHub,将ClawHub上的所有技能数据悉数扒下,导入到了自家平台。 斯坦伯格随即亲自下场回应。他透露自己此前曾收到邮件,对方抱怨ClawHub的速率限制导致他们“爬得不够快”.

来自主题: AI资讯
8802 点击    2026-03-12 16:19
编程 Agent 如何重塑工程、产品和设计

编程 Agent 如何重塑工程、产品和设计

编程 Agent 如何重塑工程、产品和设计

软件公司的 EPD(工程 Engineering、产品 Product、设计 Design)存在的意义就是做出好软件。虽然分了不同角色,但最终目标一样:做出能解决业务问题、用户用得上的功能软件。说到底,产出就是代码。这一点必须认清——因为编程 Agent 突然让写代码变得异常简单。那么,EPD 的角色定位会怎么变?

来自主题: AI技术研报
9799 点击    2026-03-12 14:49
从向量里逆向出原始文本和模型来源

从向量里逆向出原始文本和模型来源

从向量里逆向出原始文本和模型来源

用户把文本发到我们的 API,我们返回一串浮点数。没有标签,没有水印,没有任何元数据告诉你它从哪来、用的什么模型。大多数人看到这串数字,反应都是"不就是一堆浮点数嘛,能看出什么?"

来自主题: AI技术研报
7766 点击    2026-03-12 14:12
「10倍工程师」神话破灭?代码免费,懂品味才值钱

「10倍工程师」神话破灭?代码免费,懂品味才值钱

「10倍工程师」神话破灭?代码免费,懂品味才值钱

AI正在让「10倍工程师」成为新的行业底线。真正要慌的,可能不是程序员,而是那些还在把AI当玩具的人。

来自主题: AI资讯
6655 点击    2026-03-12 14:10