AI资讯新闻榜单内容搜索-Fusion

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Fusion

ICML 2026 | 我们让蒸馏模型当了采样器，Diffusion RL采样成本降低一个数量级

ICML 2026 | 我们让蒸馏模型当了采样器，Diffusion RL采样成本降低一个数量级

ICML 2026 | 我们让蒸馏模型当了采样器，Diffusion RL采样成本降低一个数量级

过去的 Diffusion RL 多聚焦于奖励设计与优化算法，训练时的采样成本被忽视。DMSampler 指出：在在线 RL 中，限制规模化的不只是奖励信号或优化器，很多时候是 rollout 本身太贵。

来自主题: AI技术研报

7665 点击 2026-08-01 10:44

满血DeepSeek V4塞进办公室！专属「Token工厂」成标配

满血DeepSeek V4塞进办公室！专属「Token工厂」成标配

满血DeepSeek V4塞进办公室！专属「Token工厂」成标配

一夜之间，Tokenmaxxing成为硅谷热议话题！

来自主题: AI技术研报

7737 点击 2026-07-23 10:40

专访Reverie袁博地：从Google X到实时交互模型，重新定义下一代AI Interface

专访Reverie袁博地：从Google X到实时交互模型，重新定义下一代AI Interface

专访Reverie袁博地：从Google X到实时交互模型，重新定义下一代AI Interface

袁博地的答案是否定的。从清华大学接触计算机视觉，到 UC Berkeley 攻读 AI 博士，再到 Google X 负责机器人的视觉系统，袁博地过去十多年的研究几乎始终围绕 Pixel 展开：从图像识别，到 GAN、Diffusion，再到图像和视频生成，技术范式不断变化，研究对象却始终指向同一件事——如何让机器理解和生成视觉世界。

来自主题: AI资讯

9100 点击 2026-07-22 15:47

上海交大提出ICRDrag：首个上下文区域拖拽模型，实现精准可控图像编辑

上海交大提出ICRDrag：首个上下文区域拖拽模型，实现精准可控图像编辑

上海交大提出ICRDrag：首个上下文区域拖拽模型，实现精准可控图像编辑

还在用 DragGAN、DragDiffusion 拖拽修图？点选拖拽容易变形、边界割裂、细节丢失的时代落幕了！ECCV 2026 ICRDrag 首创上下文区域拖拽模型，用掩码精准定位局部区域，移动、缩放、变形全都丝滑自然，兼顾精准度与画面真实感。

来自主题: AI技术研报

8234 点击 2026-07-05 09:47

斯坦福改变了LLM的生成顺序，Google把它做了出来。DiffusionGemma技术报告来了

斯坦福改变了LLM的生成顺序，Google把它做了出来。DiffusionGemma技术报告来了

斯坦福改变了LLM的生成顺序，Google把它做了出来。DiffusionGemma技术报告来了

Google DeepMind在6月份对外分享了DiffusionGemma的技术报告，明确指向了一条与现有主流完全不同的演进道路。当大家都在绞尽脑汁让大模型逐词吐字的速度变快时，谷歌干脆把生成顺序改了。

来自主题: AI技术研报

8026 点击 2026-06-24 09:54

国产模型，打平了Claude Fable 5！已上线OpenRouter

国产模型，打平了Claude Fable 5！已上线OpenRouter

国产模型，打平了Claude Fable 5！已上线OpenRouter

OpenRouter 上线了一个叫 Fusion 的新功能，把同一道题丢给一组模型，再让一个裁判模型把答案揉成一份。结果是，几个便宜的开源模型组起团来，能直接打平 Fable 5，价格只有其一半。

来自主题: AI资讯

9900 点击 2026-06-15 15:13

Mythos阴影里谷歌悄悄发模型DiffusionGemma，速度暴涨4倍

Mythos阴影里谷歌悄悄发模型DiffusionGemma，速度暴涨4倍

Mythos阴影里谷歌悄悄发模型DiffusionGemma，速度暴涨4倍

就在刚刚，谷歌闷头干了件大事：把生成图片的扩散模型，拿来写文字了，而且一出手就是4倍加速。新模型名为DiffusionGemma，它直接抛弃了传统自回归那套“逐Token生成”的打字机模式，而是像“印刷机”一样工作——

来自主题: AI资讯

11154 点击 2026-06-11 15:27

谷歌开源26B文本扩散MoE，劈柴：生成速度像赛马一样快

谷歌开源26B文本扩散MoE，劈柴：生成速度像赛马一样快

谷歌开源26B文本扩散MoE，劈柴：生成速度像赛马一样快

今天一早，谷歌又发新模型了！

来自主题: AI资讯

13215 点击 2026-06-11 14:29

扩散模型里的噪声，原来还有这样的作用：DRDD重新定义统一图像翻译

扩散模型里的噪声，原来还有这样的作用：DRDD重新定义统一图像翻译

扩散模型里的噪声，原来还有这样的作用：DRDD重新定义统一图像翻译

在图像到图像翻译（Image-to-Image Translation, I2I）这个任务上，扩散模型过去几年几乎形成了一套默认逻辑：先把输入图像和噪声混合，再一步步去噪，把目标图像 “还原” 出来。

来自主题: AI技术研报

12051 点击 2026-06-10 15:15

ICML 2026｜文生图模型也会「忘词」？复旦创智等提出Prompt Reinjection，无需训练提升文生图指令遵循能力

ICML 2026｜文生图模型也会「忘词」？复旦创智等提出Prompt Reinjection，无需训练提升文生图指令遵循能力

ICML 2026｜文生图模型也会「忘词」？复旦创智等提出Prompt Reinjection，无需训练提升文生图指令遵循能力

近年来，文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image，扩散模型已经能够生成高质量图像，也能处理越来越复杂的文本提示。

来自主题: AI技术研报

10241 点击 2026-06-09 10:02

上一页当前第1页,共22页下一页