AI资讯新闻榜单内容搜索-Al

神秘模型「大象」：仅100B拿下SOTA，Token效率超高！

神秘模型Elephant的面纱，终于被揭开了。

来自主题: AI技术研报

5673 点击 2026-04-22 10:02

先说一个很多人没意识到的事实：2026年了，每个主流Agent框架底下的工具调用训练数据，格式全是乱的。

来自主题: AI资讯

10673 点击 2026-04-22 09:12

AI科技评论独家获悉，卡内基梅隆⼤学机器⼈研究院（CMURI）博⼠后、悉尼⼤学（USYD）⻓聘助理教授WilliamZhi联合创办具⾝智能公司⸺ZenoAI（芝诺机器⼈），致⼒于打造通⽤全栈物理智能（Full-stackPhysicalAI），提供可靠的全⾝灵巧操作解决⽅案。

来自主题: AI资讯

8165 点击 2026-04-21 13:17

「学术铁幕！连 ICLR Oral 都给 desk-reject 了。」

来自主题: AI资讯

10233 点击 2026-04-21 10:22

今天，阿里发布了其下一代旗舰模型的早期预览版：Qwen3.6-Max-Preview。在第三方评测榜单Artificial Analysis的智能指数排名中，Qwen3.6-Max-Preview的得分为52分，小幅超过GLM-5.1、MiniMax-M2.7，成为这一榜单上得分最高的国产模型。

来自主题: AI资讯

8711 点击 2026-04-20 22:21

本文主要介绍来自该团队的最新论文：Scalable Object Relation Encoding for Better 3D Spatial Reasoning in Large Language Models。

来自主题: AI技术研报

6336 点击 2026-04-20 14:04

如何创建大规模的Physical AI数据，来加速Physical AI开发者的进展。我们采取的方法，本质上是用算力去换数据；

来自主题: AI资讯

9019 点击 2026-04-20 09:44

前段时间有个叫 Happy Horse 的模型实火了一把，在知名 AI 评测分析平台 Artificial Analysis 上，直接把 Seedance 2.0 挤到了第二。

来自主题: AI产品测评

7357 点击 2026-04-20 09:05

一年前，DeepSeek R1 横空出世，人们才意识到，真正让模型产生推理能力质变的，不必是更大的预训练规模 —— 后训练，用强化学习、过程奖励、闭环反馈，以极低的代价解锁了原本需要数倍算力才能触达的能力边界。

来自主题: AI技术研报

6755 点击 2026-04-20 09:00

伯克利团队归纳出7种反复出现的模式：智能体和评测程序共享运行环境、标准答案暴露给被测系统、对不可信输入调用eval()、LLM裁判缺乏输入过滤、字符串匹配过于宽松、评分逻辑本身有bug、以及评测程序信任被测系统产生的输出。

来自主题: AI技术研报

9225 点击 2026-04-19 13:40