AI资讯新闻榜单内容搜索-训练模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练模型

ECCV 2026｜Google等推出VGGRPO：用4D隐空间奖励实现世界一致的视频生成

ECCV 2026｜Google等推出VGGRPO：用4D隐空间奖励实现世界一致的视频生成

ECCV 2026｜Google等推出VGGRPO：用4D隐空间奖励实现世界一致的视频生成

最近，来自 Google、哥本哈根大学、牛津大学等机构的研究者提出了 VGGRPO（Visual Geometry GRPO，收录于 ECCV 2026）。这项工作聚焦于一个核心问题：如何在不牺牲预训练模型泛化能力的前提下，高效地提升视频生成的几何一致性，并使其适用于动态场景。其核心思路是，在隐空间（latent space）中利用 4D 几何奖励，进行几何感知的视频后训练。

来自主题: AI技术研报

9600 点击 2026-07-18 10:09

全球首个！「具身原生」世界动作模型LingBot-VA 2.0来了

全球首个！「具身原生」世界动作模型LingBot-VA 2.0来了

全球首个！「具身原生」世界动作模型LingBot-VA 2.0来了

蚂蚁集团旗下具身智能公司蚂蚁灵波，把这块最难的拼图拍上了桌：LingBot-VA 2.0——行业第一个具身原生预训练模型。所谓「具身原生」，一句话说清楚：不是拿现成的数字世界模型做嫁接，而是从数据、训练目标到模型架构，每一层都为「机器人在物理世界干活」而生—

来自主题: AI资讯

9036 点击 2026-07-10 15:14

ICML 2026 | 计算所联合ETH研究者提出WorldCache，视频世界模型近似无损提速3.7 倍

ICML 2026 | 计算所联合ETH研究者提出WorldCache，视频世界模型近似无损提速3.7 倍

ICML 2026 | 计算所联合ETH研究者提出WorldCache，视频世界模型近似无损提速3.7 倍

如果说扩散世界模型的瓶颈，是每一步去噪都要把同一个大 Transformer 再跑一遍，那么 WorldCache 的思路就是：不要再把所有 Token、所有时间步都当成同一件事。这篇工作把 “哪些内容适合缓存”和“哪些时刻必须重算” 拆开处理，在不重新训练模型、几乎不增加额外显存的前提下，把缓存真正做成了一套更贴合世界模型结构的推理策略。

来自主题: AI技术研报

8389 点击 2026-06-03 10:02

当我用 GitHub 爆火项目，从 0 完整训练了一个「专属小模型」，仿佛发现了新世界！

当我用 GitHub 爆火项目，从 0 完整训练了一个「专属小模型」，仿佛发现了新世界！

当我用 GitHub 爆火项目，从 0 完整训练了一个「专属小模型」，仿佛发现了新世界！

我最近当 AI 班狗刷抖音，一周里被同一个项目推流了三次。项目叫 MiniMind。打开 GitHub，50.4K stars，持续上涨种。这个项目大致就是：几块钱，几个小时，从 0 开始训练一个几十 MB 的小模型。

来自主题: AI资讯

10464 点击 2026-05-23 10:16

ICLR 2026 | PIL：基于线性代理的不可学习样本生成方法

ICLR 2026 | PIL：基于线性代理的不可学习样本生成方法

ICLR 2026 | PIL：基于线性代理的不可学习样本生成方法

不可学习样本（Unlearnable Examples）是一类用于数据保护的技术，其核心思想是在原始数据中注入人类难以察觉的微小扰动，使得未经授权的第三方在使用这些数据训练模型时，模型的泛化性能显著下降，甚至接近随机猜测，从而达到阻止数据被滥用的目的。

来自主题: AI技术研报

9556 点击 2026-02-18 13:27

语义分割别无脑用Argmax！港中文新算法：三行代码，推理速度提升10倍

语义分割别无脑用Argmax！港中文新算法：三行代码，推理速度提升10倍

语义分割别无脑用Argmax！港中文新算法：三行代码，推理速度提升10倍

香港中文大学提出了一个全新的算法框架RankSEG，用于提升语义分割任务的性能。传统方法在预测阶段使用threshold或argmax生成掩码，但这种方法并非最优。RankSEG无需重新训练模型，仅需在推理阶段增加三行代码，即可显著提高Dice或IoU等分割指标。

来自主题: AI技术研报

10170 点击 2026-01-05 14:27

无预训练模型拿下ARC-AGI榜三！Mamba作者用压缩原理挑战Scaling Law

无预训练模型拿下ARC-AGI榜三！Mamba作者用压缩原理挑战Scaling Law

无预训练模型拿下ARC-AGI榜三！Mamba作者用压缩原理挑战Scaling Law

压缩即智能，又有新进展！

来自主题: AI技术研报

9812 点击 2025-12-16 09:56

2比特复数模型媲美全精度！北大通用框架让大模型在手机上也能流畅运行

2比特复数模型媲美全精度！北大通用框架让大模型在手机上也能流畅运行

2比特复数模型媲美全精度！北大通用框架让大模型在手机上也能流畅运行

近日，北京大学团队提出一个直接基于已有预训练模型进行极低比特量化的通用框架——Fairy2i。该框架通过广泛线性表示将实数模型无损转换为复数形式，再结合相位感知量化与递归残差量化，实现了在仅2比特的情况下，性能接近全精度模型的突破性进展。

来自主题: AI技术研报

8432 点击 2025-12-10 14:28

时薪150美元！华尔街精英亲自教AI干掉「自己人」

时薪150美元！华尔街精英亲自教AI干掉「自己人」

时薪150美元！华尔街精英亲自教AI干掉「自己人」

AI训练背后，正在上演一场新的「华尔街迁徙」！前银行家纷纷化身AI导师，用自己的专业知识帮助OpenAI、xAI、Scale AI等AI公司训练模型，华尔街精英正在成为AI重塑华尔街的幕后推手。

来自主题: AI资讯

9646 点击 2025-11-26 13:47

数据集蒸馏，连发两篇顶会！10%样本实现全量性能，鲁棒不失真

数据集蒸馏，连发两篇顶会！10%样本实现全量性能，鲁棒不失真

数据集蒸馏，连发两篇顶会！10%样本实现全量性能，鲁棒不失真

数据集蒸馏是一种用少量合成数据替代全量数据训练模型的技术，能让模型高效又节能。WMDD和GUARD两项研究分别解决了如何保留原始数据特性并提升模型对抗扰动能力的问题，使模型在少量数据上训练时既准确又可靠。

来自主题: AI技术研报

10331 点击 2025-10-27 17:16

上一页当前第1页,共5页下一页