AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

7B小模型+3.8万条训练数据，就能让音频理解和推断评测基准MMAU榜单王座易主？

来自主题: AI技术研报

4898 点击 2025-03-17 10:52

想纠正LMM犯错？没用！NUS华人团队：最强o1反馈修正率不到50%

想纠正LMM犯错？没用！NUS华人团队：最强o1反馈修正率不到50%

想纠正LMM犯错？没用！NUS华人团队：最强o1反馈修正率不到50%

LMM在人类反馈下表现如何？新加坡国立大学华人团队提出InterFeedback框架，结果显示，最先进的LMM通过人类反馈纠正结果的比例不到50%！

来自主题: AI技术研报

8519 点击 2025-03-17 09:32

TRACE：因果事件建模助力视频理解大模型的时间定位能力

TRACE：因果事件建模助力视频理解大模型的时间定位能力

TRACE：因果事件建模助力视频理解大模型的时间定位能力

下班回家后你正深陷于一部两小时的综艺节目中，渴望找到那些让人捧腹的爆笑片段，却如同大海捞针。或者，在紧张刺激的足球赛中，你渴望捕捉到那决定性的绝杀瞬间，但传统 AI 视频处理技术效率低下，且模型缺乏泛化能力。为解决这些问题，香港中文大学（深圳）唐晓莹课题组联合腾讯 PCG 发布 TRACE 技术，通过因果事件建模为视频理解大模型提供精准的时间定位能力。

来自主题: AI技术研报

9943 点击 2025-03-17 09:19

CVPR 2025：无需物理引擎，一个模型搞定图像渲染与分解

CVPR 2025：无需物理引擎，一个模型搞定图像渲染与分解

CVPR 2025：无需物理引擎，一个模型搞定图像渲染与分解

无需物理引擎，单个模型也能实现“渲染+逆渲染”了！

来自主题: AI技术研报

6647 点击 2025-03-17 08:53

谷歌重磅推出全新Scaling Law，抢救Transformer！3万亿美元AI面临岔路

谷歌重磅推出全新Scaling Law，抢救Transformer！3万亿美元AI面临岔路

谷歌重磅推出全新Scaling Law，抢救Transformer！3万亿美元AI面临岔路

谷歌团队发现了全新Scaling Law！新方法DiLoCo被证明更好、更快、更强，可在多个数据中心训练越来越大的LLM。

来自主题: AI技术研报

6941 点击 2025-03-16 16:09

驯服AI，更懂物理！何恺明团队提出全新DHN「去噪哈密顿网络」

驯服AI，更懂物理！何恺明团队提出全新DHN「去噪哈密顿网络」

驯服AI，更懂物理！何恺明团队提出全新DHN「去噪哈密顿网络」

何恺明团队提出的去噪哈密顿网络（DHN），将哈密顿力学融入神经网络，突破传统局部时间步限制，还有独特去噪机制，在物理推理任务中表现卓越。

来自主题: AI技术研报

8951 点击 2025-03-16 15:22

无需训练，100%完美检索！LLM练出「火眼金睛」，InfiniRetri超长文本一针见血

无需训练，100%完美检索！LLM练出「火眼金睛」，InfiniRetri超长文本一针见血

无需训练，100%完美检索！LLM练出「火眼金睛」，InfiniRetri超长文本一针见血

LLM自身有望在无限长token下检索信息！无需训练，在检索任务「大海捞针」（Needle-in-a-Haystack）测试中，新方法InfiniRetri让有效上下文token长度从32K扩展至1000+K，让7B模型比肩72B模型。

来自主题: AI技术研报

10424 点击 2025-03-16 13:28

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

AI大佬曼宁转赞，MetaGPT团队首提「Atom of Thoughts」，原子化思考让4o-mini暴打推理模型？

大语言模型（LLM）近年来凭借训练时扩展（train-time scaling）取得了显著性能提升。然而，随着模型规模和数据量的瓶颈显现，测试时扩展（test-time scaling）成为进一步释放潜力的新方向。

来自主题: AI技术研报

9371 点击 2025-03-16 12:42

何恺明LeCun联手改造Transformer！9行代码替代归一化层，性能不减还加速

何恺明LeCun联手改造Transformer！9行代码替代归一化层，性能不减还加速

何恺明LeCun联手改造Transformer！9行代码替代归一化层，性能不减还加速

何恺明LeCun联手：Transformer不要归一化了，论文已入选CVPR2025。

来自主题: AI技术研报

11695 点击 2025-03-15 17:12

人大北邮等团队解视触觉感知统一难题，模型代码数据集全开源 | ICLR 2025

人大北邮等团队解视触觉感知统一难题，模型代码数据集全开源 | ICLR 2025

人大北邮等团队解视触觉感知统一难题，模型代码数据集全开源 | ICLR 2025

机器人怎样感知世界？

来自主题: AI技术研报

10448 点击 2025-03-15 16:18

上一页当前第289页,共424页下一页