AI资讯新闻榜单内容搜索-模型训练

斯坦福MIT联合发布Meta-Harness，Agent端到端自己优化自己，Dspy一作Omar参与研究

去年讨论Agent落地时，重点往往是Context Engineering。大家都在琢磨怎么放 Few-shot，怎么优化 RAG 检索的文本片段。但随着 Agent 任务复杂度的上升，控制数据流向、工具调度和异常处理的底层脚手架代码，往往比单纯拼接文本对系统性能的影响更大。

来自主题: AI技术研报

7406 点击 2026-04-03 09:26

3 月 31 日下午，技术圈炸了锅： Claude Code，这款被公认为当前最强的 AI 编程助手，因为一次内部失误，核心代码逻辑暴露在了全球开发者面前。

来自主题: AI技术研报

9386 点击 2026-04-03 09:25

在现实世界中通过强化学习训练智能体，往往需要大量在线试错与环境探索，这不仅成本高昂，还可能带来显著安全风险：机器人可能因试错而损坏，自动驾驶的在线探索可能危及行车安全，而持续采集交互数据本身也代价巨大。

来自主题: AI技术研报

7797 点击 2026-04-03 09:25

在时间序列预测领域，深度模型如iTransformer、PatchTST虽然性能强劲，却长期困于“黑盒”困境——预测准，但说不出为什么。

来自主题: AI技术研报

6811 点击 2026-04-02 16:23

生物医学AI智能体正从「能不能做组学分析」快速进入下一阶段的检验：做出来的结果，能不能撑得住真实的治疗决策？哈佛医学院Zitnik团队的MEDEA 给出了一条明确的技术路线：与其追求更强的骨干大模型，不如在分析流程的每一步嵌入验证机制。

来自主题: AI技术研报

7939 点击 2026-04-02 16:22

近年来，Decision-Coupled World Model 与 Model-based RL 在机器人领域取得了显著成功。通过学习环境动力学模型，智能体能够在内部模拟未来，从而进行规划与决策。但当系统从单机器人扩展到多机器人时，问题开始变得棘手。

来自主题: AI技术研报

9966 点击 2026-04-02 16:22

《读佳》获悉，由北京青阳智维科技有限公司运营“量原求索Labelease”已推出，通过媒体报道可知，该公司隶属于字节跳动。据悉，Labelease的主要作用是帮助模型团队解决模型从训练到部署全链路中

来自主题: AI资讯

9649 点击 2026-04-02 14:26

AI会用工具了，问题才真正开始…

来自主题: AI技术研报

7912 点击 2026-04-02 09:39

在构建多Agent系统（Multi-Agent Systems）时，让几个Agent互相“对话”并不难，但要让它们在局部状态不一致的情况下，敲定一个全局唯一的决策，也就是达成“一致”（Agree）或“共识（Consensus）”，却是一个极具挑战的工程难题，您可能会问为什么，这有何难？

来自主题: AI技术研报

7812 点击 2026-04-02 09:39

把Agent接入工作流，本该是件提效的乐事。

来自主题: AI技术研报

6465 点击 2026-04-01 17:03