AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
全球首个:隐空间世界模型,打通长时序双向物理因果链了!

全球首个:隐空间世界模型,打通长时序双向物理因果链了!

全球首个:隐空间世界模型,打通长时序双向物理因果链了!

你从桌上端起一杯水,大脑用了不到一秒,同时完成三件事: 估算杯子的重量,预判水面晃动的幅度,顺便绕开了旁边那个玻璃杯。

来自主题: AI技术研报
8503 点击    2026-06-30 09:53
Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?

Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?

Nvidia都在点赞的LoopWM世界模型,竟然来自一家中国初创FaceMind?

在世界模型这条路上,行业一直卡在一个几乎无解的矛盾里:想要更真实的长程模拟,就必须给模型更深的计算;可一旦把模型做得更深,部署成本、参数规模和误差累积又会迅速抬头。结果就是,大家都知道世界模型要 “想得更久”,却很难让它在现实系统里 “算得起、跑得稳”。

来自主题: AI技术研报
5418 点击    2026-06-29 15:54
Dwarkesh Patel:下一代AI,可能是干活干出来的

Dwarkesh Patel:下一代AI,可能是干活干出来的

Dwarkesh Patel:下一代AI,可能是干活干出来的

硅谷著名科技播客主持人 Dwarkesh Patel 最近抛出了一个问题:AI 的下一代训练范式会是什么?

来自主题: AI资讯
8577 点击    2026-06-29 09:20
ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

ICML 2026 Oral|大模型的能力从哪些训练数据来?北大&智源提出「机理数据归因」

近年来,大语言模型展现出了越来越强的能力,从上下文学习(In-Context Learning, ICL)到复杂推理、代码生成,这些能力不断刷新人们对模型能力边界的认知。

来自主题: AI技术研报
9023 点击    2026-06-29 09:19
独家丨清研精准完成数亿元 B3 轮融资,目标打造物理 AI 数据基础设施

独家丨清研精准完成数亿元 B3 轮融资,目标打造物理 AI 数据基础设施

独家丨清研精准完成数亿元 B3 轮融资,目标打造物理 AI 数据基础设施

清华系物理AI企业「清研精准」已于近日完成数亿元B3轮融资,本轮融资由北京市绿色能源基金、北汽产投领投,裕隆集团跟投。据悉,该轮资金将会用于核心人才招募、多模态数采设备的研发与规模化部署,以及算力采购与模型训练基础设施建设等方向。

来自主题: AI资讯
8772 点击    2026-06-29 09:11
CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

刚刚,Om AI发布全球首个面向物理世界的端侧流式多模态模型系列——VLX。VLX主打真实世界的端侧与具身场景,总共三款模型,三天连发:这三款模型连起来,不仅构成了多模态模型持续感知、精准定位、行动决策的能力闭环。

来自主题: AI技术研报
9070 点击    2026-06-28 11:14
单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题

单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题

单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题

南大王利民团队&腾讯混元的HYDRA系列(HYDRA,HYDRA-X)工作挑战了这个惯例,用一个基于ViT的统一视觉Tokenizer,帮助原生多模态模型更好地“看懂”和“创作”。训练一个基于ViT的Unified Tokenizer,使其同时具有理解和生成的能力,进而同时作为理解和生成的Autoencoder,来支持原生多模态模型(Unified Multimodal Models)的训练。

来自主题: AI技术研报
8204 点击    2026-06-28 11:13
大模型搜索总偷懒?IQuest等联合推出FORT,30B开源搜索Agent刷新同规模SOTA

大模型搜索总偷懒?IQuest等联合推出FORT,30B开源搜索Agent刷新同规模SOTA

大模型搜索总偷懒?IQuest等联合推出FORT,30B开源搜索Agent刷新同规模SOTA

来自至知创新研究院(IQuest Research)、中国人民大学高瓴人工智能学院、KAUST等机构的研究团队提出了FORT,一个面向Deep Search Agent的shortcut-resistant training-data synthesis framework。

来自主题: AI技术研报
8699 点击    2026-06-27 11:27