AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
LLM近期重大架构进化一览:从Gemma 4到DeepSeek V4

LLM近期重大架构进化一览:从Gemma 4到DeepSeek V4

LLM近期重大架构进化一览:从Gemma 4到DeepSeek V4

过去一段时间,很多人对大模型都有一个明显感受:token 总是不够用。

来自主题: AI技术研报
6851 点击    2026-05-19 15:32
伯克利神作背刺OpenAI:持续学习才是真神!

伯克利神作背刺OpenAI:持续学习才是真神!

伯克利神作背刺OpenAI:持续学习才是真神!

伯克利等发布FST框架:通过快慢分层解决大模型持续学习死局。

来自主题: AI技术研报
7858 点击    2026-05-19 15:31
ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考

ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考

ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考

近年来,Chain-of-Thought(CoT)推理已经成为提升大语言模型和多模态大语言模型复杂问题求解能力的重要技术路径。

来自主题: AI技术研报
6522 点击    2026-05-19 10:01
9.9元起!三大运营商杀入Token生意,以后用AI就像交话费?

9.9元起!三大运营商杀入Token生意,以后用AI就像交话费?

9.9元起!三大运营商杀入Token生意,以后用AI就像交话费?

最近几天,中国电信、中国移动、中国联通接连推出Token套餐及相关AI服务,面向个人、家庭、开发者、中小微企业等用户销售大模型调用量。这是三大运营商首次正式入局Token生意,而此前相关业务由大模型厂商、互联网大厂和云服务商主导。

来自主题: AI资讯
8181 点击    2026-05-18 21:38
ICML 2026 | 华为GTS提出AI训练数据新方法,Amazon/Google作者团队「光速跟进」:难度自适应训练正在成为新范式

ICML 2026 | 华为GTS提出AI训练数据新方法,Amazon/Google作者团队「光速跟进」:难度自适应训练正在成为新范式

ICML 2026 | 华为GTS提出AI训练数据新方法,Amazon/Google作者团队「光速跟进」:难度自适应训练正在成为新范式

在大模型后训练中,数据不再只是 “越多越好”,而是要像人类学习一样,动态选择最合适难度的样本。华为提出的 EDCO 方法,将样本难度估计与动态课程编排引入领域大模型微调;数月后,由 Rutgers、Amazon、Google 等作者参与的 DARE 论文即引用 EDCO,并将其作为难度感知强化学习训练的重要对比基线。

来自主题: AI技术研报
5226 点击    2026-05-18 15:29
ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略

ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略

ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略

用过推理型大模型的人,大概率都熟悉这种体验:模型似乎在认真思考,但屏幕上长时间没有真正有用的内容;如果让它一开始就输出,又很容易出现仓促判断,后面的推理还要被早期错误牵着走。

来自主题: AI技术研报
9454 点击    2026-05-18 15:27
当SFT遇上RL:基于样本学习阶段的动态策略优化机制

当SFT遇上RL:基于样本学习阶段的动态策略优化机制

当SFT遇上RL:基于样本学习阶段的动态策略优化机制

过去一段时间里,在围绕大模型推理能力增强的研究中,SFT 和 RL 是两类核心后训练范式 —— 前者稳定收敛快,能高效吸收高质量推理数据;后者更具探索性,有望推动模型实现复杂推理和分布外泛化。

来自主题: AI技术研报
6486 点击    2026-05-18 09:53
首发 | 宠物健康大模型公司连融两轮,软硬一体化布局,已服务超200家宠物医院

首发 | 宠物健康大模型公司连融两轮,软硬一体化布局,已服务超200家宠物医院

首发 | 宠物健康大模型公司连融两轮,软硬一体化布局,已服务超200家宠物医院

宠物大模型健康公司重庆绮算法科技有限公司(以下简称“绮算法”)、智谱“Z计划”生态企业,近日完成数千万元融资,投资方为启赋资本与聚恒创投。本轮资金将主要用于产品迭代、模型能力深化及市场拓展。

来自主题: AI资讯
8855 点击    2026-05-17 15:09