AI技术研报-这里有最前沿的人工智能技术解读

英伟达给机器人装上龙虾大脑！具身智能的Harness来了

Harness（驾驭）的风，终究还是从大模型，吹到了机器人！

来自主题: AI技术研报

9096 点击 2026-04-03 10:18

一键白标 Claude Code：自定义命令 + 启动画面 + 配置隔离，Skill可自取

这两天，我被一张图反复种草。

来自主题: AI技术研报

8228 点击 2026-04-03 09:27

斯坦福MIT联合发布Meta-Harness，Agent端到端自己优化自己，Dspy一作Omar参与研究

去年讨论Agent落地时，重点往往是Context Engineering。大家都在琢磨怎么放 Few-shot，怎么优化 RAG 检索的文本片段。但随着 Agent 任务复杂度的上升，控制数据流向、工具调度和异常处理的底层脚手架代码，往往比单纯拼接文本对系统性能的影响更大。

来自主题: AI技术研报

7399 点击 2026-04-03 09:26

Claude Code 源码震撼泄露，一起学习下最前沿的 Harness 工程

3 月 31 日下午，技术圈炸了锅： Claude Code，这款被公认为当前最强的 AI 编程助手，因为一次内部失误，核心代码逻辑暴露在了全球开发者面前。

来自主题: AI技术研报

9371 点击 2026-04-03 09:25

重构跨域RL框架！理论驱动「双重对齐」让跨域迁移「质变」

在现实世界中通过强化学习训练智能体，往往需要大量在线试错与环境探索，这不仅成本高昂，还可能带来显著安全风险：机器人可能因试错而损坏，自动驾驶的在线探索可能危及行车安全，而持续采集交互数据本身也代价巨大。

来自主题: AI技术研报

7790 点击 2026-04-03 09:25

中国最强编程模型来了！阿里Qwen3.6-Plus性能直逼Claude，国产大模型杀入决赛圈

什么这code那code，先别code了，因为—— 中国最强编程模型来了！

来自主题: AI技术研报

5384 点击 2026-04-02 17:01

别再用黑盒预测了！即插即用模块通过前置分解让iTransformer/PatchTST既准又可解释

在时间序列预测领域，深度模型如iTransformer、PatchTST虽然性能强劲，却长期困于“黑盒”困境——预测准，但说不出为什么。

来自主题: AI技术研报

6809 点击 2026-04-02 16:23

哈佛医学院做了5679次组学分析：大模型能力没差别，关键在验证

生物医学AI智能体正从「能不能做组学分析」快速进入下一阶段的检验：做出来的结果，能不能撑得住真实的治疗决策？哈佛医学院Zitnik团队的MEDEA 给出了一条明确的技术路线：与其追求更强的骨干大模型，不如在分析流程的每一步嵌入验证机制。

来自主题: AI技术研报

7937 点击 2026-04-02 16:22

ICLR 2026 | 世界模型卡在多机器人协作？一个「顺序分解」思路打通

近年来，Decision-Coupled World Model 与 Model-based RL 在机器人领域取得了显著成功。通过学习环境动力学模型，智能体能够在内部模拟未来，从而进行规划与决策。但当系统从单机器人扩展到多机器人时，问题开始变得棘手。

来自主题: AI技术研报

9965 点击 2026-04-02 16:22

翻遍Claude Code泄露的50万行代码，我终于发现了它好用的秘密

Claude Code 不是一个套了终端界面的 AI 聊天工具。

来自主题: AI技术研报

6398 点击 2026-04-02 10:08

Cursor们为什么都开始自研模型？

Tanay Jaipuria 本周写了一篇很有意思的文章，核心论点只有一句话：每家 AI 应用公司最终都会垂直整合，变成全栈公司。

来自主题: AI技术研报

5969 点击 2026-04-02 10:07

让Agent把成功经验固化成skills，跨模型复用成功率100%

AI会用工具了，问题才真正开始…

来自主题: AI技术研报

7911 点击 2026-04-02 09:39

苏黎世联邦理工实测：一句Prompt就能摧毁16个Agent组成的「共识网络」多Agent避坑指南来了

在构建多Agent系统（Multi-Agent Systems）时，让几个Agent互相“对话”并不难，但要让它们在局部状态不一致的情况下，敲定一个全局唯一的决策，也就是达成“一致”（Agree）或“共识（Consensus）”，却是一个极具挑战的工程难题，您可能会问为什么，这有何难？

来自主题: AI技术研报

7810 点击 2026-04-02 09:39

Claude Code 源码泄漏了，但我不打算写源码分析分析文章

Claude Code 源码泄漏了，满屏都是“深度分析”文章。也有朋友让我写一篇分析文章，但代码才泄漏十几个小时，50 多万行代码，想深度分析清楚还是有难度的。不过授人以鱼不如授人以渔，我更想聊聊：拿到一份开源代码，怎么把它真正学到手。

来自主题: AI技术研报

9886 点击 2026-04-02 09:38

88岁算法祖师爷惊呆！Claude联手GPT攻破30年难题，14页论文0修改

「哈密顿分解」难题，终于破解！88岁「算法祖师爷」高德纳再更论文，Claude 4.6+GPT-5.4联合破解了奇偶数情形。甚至，GPT-5.4直出一篇14页论文，引爆全网。

来自主题: AI技术研报

6859 点击 2026-04-01 17:05

龙虾成本狂降58%！清华人大面壁等最新开源“智能调度员”

把Agent接入工作流，本该是件提效的乐事。

来自主题: AI技术研报

6465 点击 2026-04-01 17:03

比全球最强推理引擎还快2倍，斯坦福、普林斯顿破解大模型「串行魔咒」

在大语言模型推理领域，虽然「推测解码」（Speculative Decoding，SD）已成为加速生成的标准配置，但它依然存在一个致命弱点： drafting（草拟）和 verification（验证）之间必须串行进行。

来自主题: AI技术研报

7403 点击 2026-04-01 16:20

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache，刷新多模态生成模型推理加速新基准

FLUX 、Qwen-Image 等多模态生成模型的推理速度一直是工业级多模态模型落地的痛点。传统的特征缓存（Feature Caching）方案在追求高倍率加速时，常因瞬时速度的剧烈波动导致轨迹漂移。

来自主题: AI技术研报

7625 点击 2026-04-01 16:13

Claude Code 源码泄漏，全部细节与始末

2026 年 3 月 31 日，安全研究员 Chaofan Shou 发现 Anthropic 的 Claude Code 全部源码通过 npm 包里的一个 source map 文件暴露在了公网上

来自主题: AI技术研报

9760 点击 2026-04-01 10:50

神人拆解CC源码！源码里真正的高杠杆用法；ClaudeCode本质上是一个多Agent编排平台

Claude Code 源码泄露为业界一下子打开了 Agent 进化的大门。

来自主题: AI技术研报

6775 点击 2026-04-01 10:13

2倍提速！KV缓存压缩不只看重要性，上交大团队让模型推理「又快又稳」 | ICLR'26

长上下文推理已经成了VLM/LLM的默认形态。

来自主题: AI技术研报

5478 点击 2026-04-01 09:40

NVIDIA GTC上登顶的DeepResearch Bench，到底在评什么？

3 月 16 日，在刚刚结束的 NVIDIA GTC 2026 大会上，黄仁勋在长达三小时的 Keynote 演讲中发布了 NVIDIA Agent Toolkit 和 AI-Q 开放智能体蓝图，将 AI Agent 定位为下一个重大前沿。

来自主题: AI技术研报

8354 点击 2026-04-01 09:39

Last30Days：GitHub 一天狂涨 3000 星的「终局情报 Skill」，一文看懂如何配置

前天，我刷 GitHub Trending 的时候，看到第一名是个叫Last 30 Days的项目。

来自主题: AI技术研报

9005 点击 2026-03-31 15:30

唐杰高徒打造龙虾投资军团！量化私募全线Agent，开源狂揽39k星

好家伙，投资版龙虾也来了。还是GitHub开源项目里最近高热高赞的那种。

来自主题: AI技术研报

6340 点击 2026-03-31 15:04

你的「龙虾」还好用吗？人大林衍凯教授：OpenClaw就像早期Linux，真正的竞争才刚开始

过去数月，AI 领域很难绕开一个名字 ——OpenClaw。这个项目在极短时间内获得了爆发式关注：数十万星标、惊人的 Token 消耗，以及几乎所有大厂的快速跟进。从表面上看，它像是又一个现象级 AI 产品；但如果进一步审视，一个更值得思考的问题随之浮现 ——OpenClaw 的出现，究竟意味着什么？它真的是一次技术突破，还是某种更深层变化的信号？

来自主题: AI技术研报

5337 点击 2026-03-31 14:40

1毫秒级，最快的人体动作捕捉服！开源715万帧数据集| CVPR'26

全球首个1毫秒级人体动作捕捉系统FlashCap，通过闪烁LED与事件相机结合，实现1000Hz超高帧率捕捉。无需昂贵设备或强光环境，低成本穿戴服即可精准捕捉极速动作。团队同步开源715万帧的FlashMotion数据集与多模态模型ResPose，显著提升运动分析精度，推动体育、VR与机器人领域迈向高动态智能新阶段。

来自主题: AI技术研报

6233 点击 2026-03-31 14:40

2700GB高质量数据，训出空间智能SOTA，背后秘诀全栈开源

什么在限制空间智能落地？

来自主题: AI技术研报

6328 点击 2026-03-31 14:39

直指具身智能核心瓶颈，千寻智能高阳团队提出 Point-VLA：首次以视觉定位实现语言指令精准执行

设想这样一个场景：你打电话让同事去办公室某个地方拿东西，仅凭语言描述位置是多么困难。在办公室里，从一堆已经喝过的矿泉水瓶中，让对面同学递过来你之前喝过的那个，只用语言几乎无法准确描述——「左边第二个」？「有点旧的那个」？这时候，人们更倾向于用手指一下，或者拿出图片来指代。

来自主题: AI技术研报

7131 点击 2026-03-31 14:37

让大模型看懂「高亮标注」：在注意力计算前编辑Key向量，用频谱分解让模型「听你指挥」丨ICLR'26

想让大模型重点关注提示词里的某句话可没那么容易。

来自主题: AI技术研报

8368 点击 2026-03-31 14:07

Nicholas Carlini：当 AI 比所有人都更擅长找漏洞，安全行业还剩几个月？

Anthropic 研究科学家 Nicholas Carlini 在 [un]prompted 2026 安全会议上用不到 25 分钟演示了一件事：语言模型现在可以自主找到并利用零日漏洞，目标包括 Linux 内核这种被人类安全专家审计了几十年的软件。

来自主题: AI技术研报

9755 点击 2026-03-31 14:06

AI技术研报-这里有最前沿的人工智能技术解读

英伟达给机器人装上龙虾大脑！具身智能的Harness来了

一键白标 Claude Code：自定义命令 + 启动画面 + 配置隔离，Skill可自取

斯坦福MIT联合发布Meta-Harness，Agent端到端自己优化自己，Dspy一作Omar参与研究

Claude Code 源码震撼泄露，一起学习下最前沿的 Harness 工程

重构跨域RL框架！理论驱动「双重对齐」让跨域迁移「质变」

中国最强编程模型来了！ 阿里Qwen3.6-Plus性能直逼Claude，国产大模型杀入决赛圈

别再用黑盒预测了！即插即用模块通过前置分解让iTransformer/PatchTST既准又可解释

哈佛医学院做了5679次组学分析：大模型能力没差别，关键在验证

ICLR 2026 | 世界模型卡在多机器人协作？一个「顺序分解」思路打通

翻遍Claude Code泄露的50万行代码，我终于发现了它好用的秘密

Cursor们为什么都开始自研模型？

让Agent把成功经验固化成skills，跨模型复用成功率100%

苏黎世联邦理工实测：一句Prompt就能摧毁16个Agent组成的「共识网络」多Agent避坑指南来了

Claude Code 源码泄漏了，但我不打算写源码分析分析文章

88岁算法祖师爷惊呆！Claude联手GPT攻破30年难题，14页论文0修改

龙虾成本狂降58%！清华人大面壁等最新开源“智能调度员”

比全球最强推理引擎还快2倍，斯坦福、普林斯顿破解大模型「串行魔咒」

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache，刷新多模态生成模型推理加速新基准

Claude Code 源码泄漏，全部细节与始末

神人拆解CC源码！源码里真正的高杠杆用法；ClaudeCode本质上是一个多Agent编排平台

2倍提速！KV缓存压缩不只看重要性，上交大团队让模型推理「又快又稳」 | ICLR'26

NVIDIA GTC上登顶的DeepResearch Bench，到底在评什么？

Last30Days：GitHub 一天狂涨 3000 星的「终局情报 Skill」，一文看懂如何配置

唐杰高徒打造龙虾投资军团！量化私募全线Agent，开源狂揽39k星

你的「龙虾」还好用吗？人大林衍凯教授：OpenClaw就像早期Linux，真正的竞争才刚开始

1毫秒级，最快的人体动作捕捉服！开源715万帧数据集| CVPR'26

2700GB高质量数据，训出空间智能SOTA，背后秘诀全栈开源

直指具身智能核心瓶颈，千寻智能高阳团队提出 Point-VLA：首次以视觉定位实现语言指令精准执行

让大模型看懂「高亮标注」：在注意力计算前编辑Key向量，用频谱分解让模型「听你指挥」丨ICLR'26

Nicholas Carlini：当 AI 比所有人都更擅长找漏洞，安全行业还剩几个月？

中国最强编程模型来了！阿里Qwen3.6-Plus性能直逼Claude，国产大模型杀入决赛圈