AI资讯新闻榜单内容搜索-GE

Agent2025年终报告来了，UC伯克利、斯坦福和IBM联合发布

2025就要过去了。UC Berkeley、Stanford和IBM联手做了一件大事。他们调研了306份在一线“造 Agent”的从业者问卷，并深度访谈了20个已经成功落地并产生价值的一线企业案例（涵盖金融、科技、医疗等领域）。试图回答一个最朴素的工程问题：一个能用的、赚钱的Agent，到底是用什么架构搭出来的？

来自主题: AI技术研报

6882 点击 2025-12-08 08:52

Agent微调复活？英伟达开源8B新模型带飞GPT-5：在HLE狂卷37分，还把成本打下来

当问题又深又复杂时，一味上最强模型既贵又慢。测试时扩展能想得更久，却不一定想得更对。

来自主题: AI技术研报

10193 点击 2025-12-08 08:51

奥特曼仓促亮剑GPT-5.2！一张图爆火全网，全面碾压Gemini 3

紧急反击！自从谷歌放出Gemini 3之后，OpenAI快被逼疯了，奥特曼甚至宣布公司进入了「红色警戒」状态。据The Verge爆料，熟悉OpenAI计划的消息人士透露，OpenAI将在下周（12月9号）发布GPT-5.2，首次对Gemini 3做出正面回应。

来自主题: AI资讯

8684 点击 2025-12-07 12:21

谷歌最强大模型付费上线，在DeepSeek开源后被吐槽太贵

奥特曼又得拉响红色警报了。刚刚，谷歌再次扔出重磅炸弹——Gemini 3 Deep Think正式上线！轻松把草图变成逼真3D场景，不仅结构还原到位，就连镂空花纹与光影都处理得明明白白。

来自主题: AI资讯

8760 点击 2025-12-06 11:19

基于文本AI的终结？Agent协作可直接「复制思维」，Token效率暴涨

一直以来，传统 MAS 依赖自然语言沟通，各个 LLM 之间用文本交流思路。这种方法虽然可解释，但冗长、低效、信息易丢失。LatentMAS 则让智能体直接交换内部的隐藏层表示与 KV-cache 工作记忆，做到了：

来自主题: AI技术研报

7685 点击 2025-12-06 11:08

首帧的真正秘密被揭开了：视频生成模型竟然把它当成「记忆体」

在 Text-to-Video / Image-to-Video 技术突飞猛进的今天，我们已经习惯了这样一个常识：视频生成的第一帧（First Frame）只是时间轴的起点，是后续动画的起始画面。

来自主题: AI技术研报

8772 点击 2025-12-06 11:03

北航领衔发布300页代码智能综述：从基础模型到智能体，一次读懂Code LLM全景图

这篇学术论长文由北京航空航天大学复杂关键软件环境全国重点实验室领衔。《From Code Foundation Models to Agents and Applications》一文是对过去几年代码智能领域的一次系统梳理：模型、任务、训练、智能体、安全与应用都被串联成了一条完整、连贯的技术链路。

来自主题: AI技术研报

9020 点击 2025-12-06 10:54

谷歌IMO金牌级Gemini 3深夜上线！华人大神挂帅，OpenAI无力反击

太劲爆了！不过半月，谷歌DeepMind终于放出了IMO最强金牌模型——Gemini 3 Deep Think。今天，Gemini 3 Deep Think已在Gemini App上线，所有Ultra用户即可体验。

来自主题: AI资讯

9779 点击 2025-12-05 12:38

超越π0.5，复旦团队首创「世界模型+具身训练+强化学习」闭环框架

Vision–Language–Action（VLA）策略正逐渐成为机器人迈向通用操作智能的重要技术路径：这类策略能够在统一模型内同时处理视觉感知、语言指令并生成连续控制信号。

来自主题: AI技术研报

9422 点击 2025-12-05 09:27

Code LLM全景综述，从LLM到Agent，全文长303页，北航阿里字节等12家机构联合撰写｜最新

这篇论文由北京航空航天大学、阿里巴巴、字节跳动、上海人工智能实验室等几十家顶尖机构联合撰写，全文长达303页，是对当前“代码大模型（Code LLMs）”领域最详尽的百科全书式指南。

来自主题: AI技术研报

11719 点击 2025-12-05 09:24