AI资讯新闻榜单内容搜索-大模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大模型

用SFT打出RL的效果？微软联合提出高效后训练算法

用SFT打出RL的效果？微软联合提出高效后训练算法

用SFT打出RL的效果？微软联合提出高效后训练算法

在大模型后训练阶段，监督微调（SFT）和强化学习（RL）是两根不可或缺的支柱。SFT 利用高质量的离线（Off-policy）数据快速注入知识，但受限于静态数据分布，泛化能力往往容易触及天花板并带来灾难性遗忘；RL 则允许模型在探索中不断自我迭代，产生与当前策略同分布（On-policy）的数据，上限极高，但往往伴随着训练极度不稳定、计算资源消耗巨大的痛点。

来自主题: AI技术研报

5979 点击 2026-03-26 10:47

Sand.ai开源发布MagiCompiler：突破局部编译界限，定义训推性能上限

Sand.ai开源发布MagiCompiler：突破局部编译界限，定义训推性能上限

Sand.ai开源发布MagiCompiler：突破局部编译界限，定义训推性能上限

大模型开发者常面临一个两难选择：要速度，还是省显存？

来自主题: AI技术研报

6770 点击 2026-03-25 14:17

对抗KV Cache压缩的脆弱性：两行代码以最坏风险控制防御底层假设崩塌

对抗KV Cache压缩的脆弱性：两行代码以最坏风险控制防御底层假设崩塌

对抗KV Cache压缩的脆弱性：两行代码以最坏风险控制防御底层假设崩塌

随着大模型长上下文能力快速增长，海量 KV Cache 存储需求急剧增加，各类 KV Cache 压缩方法如雨后春笋般涌现。然而，这些方案在真实场景中的工程落地却常常陷入困境。

来自主题: AI技术研报

9420 点击 2026-03-25 13:41

刘强东的“龙虾天团”来了！首次开源通用基础大模型

刘强东的“龙虾天团”来了！首次开源通用基础大模型

刘强东的“龙虾天团”来了！首次开源通用基础大模型

京东云直接把小龙虾搬上云端，单周用户暴涨300%。

来自主题: AI资讯

8660 点击 2026-03-25 10:14

刚刚，阿里达摩院祭出开源架构CPU王炸，直指AI Agent

刚刚，阿里达摩院祭出开源架构CPU王炸，直指AI Agent

刚刚，阿里达摩院祭出开源架构CPU王炸，直指AI Agent

RISC-V摘掉紧箍咒！坐上高端算力牌桌，首次原生跑通千亿大模型。

来自主题: AI资讯

6370 点击 2026-03-25 10:12

腾讯挖来多位字节Seed骨干，向姚顺雨汇报丨智能涌现独家

腾讯挖来多位字节Seed骨干，向姚顺雨汇报丨智能涌现独家

腾讯挖来多位字节Seed骨干，向姚顺雨汇报丨智能涌现独家

据接近腾讯混元团队的知情人士透露，原字节Seed视觉AI平台团队负责人肖学锋，Infra团队张弛于近期低调入职腾讯，负责大模型Infra相关工作，向腾讯首席AI科学家姚顺雨汇报。

来自主题: AI资讯

8791 点击 2026-03-24 22:32

鼠标点3下就能锁定打击？五角大楼曝光美军AI大脑

鼠标点3下就能锁定打击？五角大楼曝光美军AI大脑

鼠标点3下就能锁定打击？五角大楼曝光美军AI大脑

当大众还在热衷于让大模型编代码、写周报或者生成搞笑图片时，硅谷最顶尖的AI技术，已经悄悄渗入了五角大楼的「杀伤链」。

来自主题: AI资讯

10176 点击 2026-03-23 14:12

网易龙虾来了！生成式AI盛会最新嘉宾公布，腾讯混元领衔参与大模型记忆研讨会

网易龙虾来了！生成式AI盛会最新嘉宾公布，腾讯混元领衔参与大模型记忆研讨会

网易龙虾来了！生成式AI盛会最新嘉宾公布，腾讯混元领衔参与大模型记忆研讨会

4月21-22日北京站将正式举行~

来自主题: AI资讯

10263 点击 2026-03-23 13:45

浙大团队破解多模态模型「盲目自信」：先校准置信度，再分配算力丨CVPR'26

浙大团队破解多模态模型「盲目自信」：先校准置信度，再分配算力丨CVPR'26

浙大团队破解多模态模型「盲目自信」：先校准置信度，再分配算力丨CVPR'26

多模态大模型，到底有多“嘴硬”？浙江大学联合阿里巴巴、香港城市大

来自主题: AI技术研报

7742 点击 2026-03-23 09:51

林俊旸离职后，阿里Qwen3.5首次发新

林俊旸离职后，阿里Qwen3.5首次发新

林俊旸离职后，阿里Qwen3.5首次发新

今日，阿里千问最新旗舰模型预览版Qwen3.5-Max-Preview正式亮相，并登上全球大模型评测平台LMArena。在最新榜单中，该模型拿下1464分，进入第一梯队，同时带动阿里千问跻身全球大模型实验室前五、国内第一。

来自主题: AI资讯

8586 点击 2026-03-20 14:40

上一页当前第36页,共538页下一页