AI资讯新闻榜单内容搜索-模型训练

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？又该如何定义？

来自主题: AI技术研报

8950 点击 2025-06-10 16:18

1.93bit量化之后的 DeepSeek-R1（0528），编程能力依然能超过Claude 4 Sonnet？

来自主题: AI技术研报

8003 点击 2025-06-10 15:28

传统的视频编辑工作流，正在被AI彻底重塑。

来自主题: AI技术研报

8247 点击 2025-06-10 15:23

王劲，香港大学计算机系二年级博士生，导师为罗平老师。研究兴趣包括多模态大模型训练与评测、伪造检测等，有多项工作发表于 ICML、CVPR、ICCV、ECCV 等国际学术会议。

来自主题: AI技术研报

9714 点击 2025-06-10 15:02

视觉语言模型（VLM）正经历从「感知」到「认知」的关键跃迁。当OpenAI的o3系列通过「图像思维」（Thinking with Images）让模型学会缩放、标记视觉区域时，我们看到了多模态交互的全新可能。

来自主题: AI技术研报

8715 点击 2025-06-10 14:45

大模型≠随机鹦鹉！Nature子刊最新研究证明：大模型内部存在着类似人类对现实世界概念的理解。

来自主题: AI技术研报

8007 点击 2025-06-10 11:54

让推理模型针对风险指令生成了安全输出，表象下藏着认知危机：即使生成合规答案，超60%的案例中模型并未真正理解风险。

来自主题: AI技术研报

5970 点击 2025-06-10 11:00

Time-R1通过三阶段强化学习提升模型的时间推理能力，其核心是动态奖励机制，根据任务难度和训练进程调整奖励，引导模型逐步提升性能，最终使3B小模型实现全面时间推理能力，超越671B模型。

来自主题: AI技术研报

7962 点击 2025-06-09 15:54

学会“适当暂停与总结”，大模型终于实现无限推理。

来自主题: AI技术研报

10324 点击 2025-06-09 15:20

以神经网络为核心引擎，让AI承担雷达仿真数据生成任务，还实现对雷达物理特性的建模与控制——

来自主题: AI技术研报

9090 点击 2025-06-09 14:58