AI资讯新闻榜单内容搜索-模型训练

AlphaGo作者领衔，8个机械臂协同干活0碰撞，DeepMind新作登Science子刊

一群机械臂手忙脚乱地自己干活，彼此配合、互不碰撞。

来自主题: AI技术研报

10772 点击 2025-09-10 13:21

通用问题求解器雏形已现！谷歌DeepMind重磅研究，自主发现40种全新算法

在现代科学中，几乎所有领域都依赖软件来进行计算实验。但开发这些专用的科学软件是一个非常缓慢、乏味且困难的过程，开发和测试一个新想法（一次“试错”）需要编写复杂的软件，这个过程可能耗费数周、数月甚至数年。

来自主题: AI技术研报

10219 点击 2025-09-10 12:15

人类秒懂，AI崩溃：一个简单测试，就让GPT-5、Gemini等顶级模型集体“翻车”

人类一眼就能看懂的文字，AI居然全军覆没。

来自主题: AI技术研报

7720 点击 2025-09-10 12:00

从第一性原理出发的RAG推理新范式来了，蚂蚁DIVER登顶权威基准

在当前由大语言模型（LLM）驱动的技术范式中，检索增强生成（RAG）已成为提升模型知识能力与缓解「幻觉」的核心技术。然而，现有 RAG 系统在面对需多步逻辑推理任务时仍存在显著局限，具体挑战如下：

来自主题: AI技术研报

10371 点击 2025-09-10 11:07

2025年了，AI还看不懂时钟！90%人都能答对，顶尖AI全军覆没

一般人准确率89.1%，AI最好只有13.3%。在新视觉基准ClockBench上，读模拟时钟这道「小学题」，把11个大模型难住了。为什么AI还是读不准表？是测试有问题还是AI真不行？

来自主题: AI资讯

8125 点击 2025-09-09 17:24

再也不怕面瘫脸！YouTube黑科技：AI帮你「永久微笑」，连僵尸都咧嘴笑

几十G的大模型，怎么可能塞进一台手机？YouTube却做到了：在 Shorts 相机里，AI能实时「重绘」你的脸，让你一秒变身僵尸、卡通人物，甚至瞬间拥有水光肌，效果自然到分不清真假。

来自主题: AI资讯

7844 点击 2025-09-09 17:18

Meta超级智能实验室首篇论文：重新定义RAG

Meta超级智能实验室的首篇论文，来了—— 提出了一个名为REFRAG的高效解码框架，重新定义了RAG（检索增强生成），最高可将首字生成延迟（TTFT）加速30倍。

来自主题: AI技术研报

9419 点击 2025-09-09 13:09

英伟达推出通用深度研究系统，可接入任何LLM，支持个人定制

英伟达也做深度研究智能体了。

来自主题: AI资讯

8705 点击 2025-09-09 11:58

从「会说」迈向「会做」，LLM下半场：Agentic强化学习范式综述

过去几年，大语言模型（LLM）的训练大多依赖于基于人类或数据偏好的强化学习（Preference-based Reinforcement Fine-tuning, PBRFT）：输入提示、输出文本、获得一个偏好分数。这一范式催生了 GPT-4、Llama-3 等成功的早期大模型，但局限也日益明显：缺乏长期规划、环境交互与持续学习能力。

来自主题: AI技术研报

10000 点击 2025-09-09 10:49

不微调，让LLM推理准确率暴增到99%！试下DeepConf，一个轻量级推理框架｜Meta最新

在大型语言模型（LLM）进行数学题、逻辑推理等复杂任务时，一个非常流行且有效的方法叫做 “自洽性”（Self-Consistency），通常也被称为“平行思考”。

来自主题: AI技术研报

7476 点击 2025-09-09 10:17