AI资讯新闻榜单内容搜索-大模

全球首次单机降服万亿巨模DeepSeek-V4！RL后训练框架Orbit开源！

从数学、代码、复杂推理，到多轮工具调用，大模型的很多能力的提升都离不开 RL 后训练。但当模型规模进入 MoE 万亿参数级别之后，RL 不再只是一个算法问题，同时更加是一个系统问题。

来自主题: AI技术研报

7301 点击 2026-05-28 14:51

Speech LLM 的下一个突破口：你的语音大模型可以是个「带韵律的文本模型」

相信大家都有过这样的体验：同一个系列的模型，使用文本交互的时候，模型就像开启了 “最强大脑”，数学代码等各种复杂推理任务样样精通，可是一旦将其改造成语音对话模型之后，性能就猛烈下降，严重 “降智”，经常会犯很多基本的逻辑错误。

来自主题: AI技术研报

6152 点击 2026-05-28 14:51

高分辨率视频生成不再慢半拍：让大模型保留“原味”的同时提速十余倍

当下视频生成模型正在快速逼近真实世界的画面质感，但一个现实瓶颈也越来越突出—— 那就是分辨率越高，生成所需要的时间就越长。

来自主题: AI技术研报

8182 点击 2026-05-28 14:50

ICML2026 | AutoMoT : B2D & nuScense双SOTA ，重新思考VLM和端到端驾驶的结合

大模型进入自动驾驶后，最直接的价值在于场景理解。它可以识别前车是否准备并线、行人是否可能横穿、施工区域是否会影响车道，也可以分析复杂路口中的让行关系。

来自主题: AI技术研报

10342 点击 2026-05-28 14:50

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力，看Qwen3.7 Max 是否实至名归？！

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro，阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名，仅次于 Claude Opus 4.7。除了真实场景的用户选择，在传统的大模型固定评测榜单上，像是终端能力 Terminal Bench、编程能力 SWE Bench 等，Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评

9883 点击 2026-05-28 12:06

这家创业公司发现了大模型的一个根本性缺陷

你有没有想过，我们每天用的 AI 大模型，可能在某些词汇上天生就有缺陷？不是因为训练数据不够，不是因为算力不足，而是因为语言本身的规律——那些用得少的词，模型就是学不好。更让人意外的是，这个问题早在 2025 年就被一家中国创业公司系统性地发现并解决了。

来自主题: AI技术研报

7221 点击 2026-05-28 09:52

大模型治不好的「医疗焦虑」，被这家公司用「信任」治愈了

真正的医疗 AI 需要架构重塑。

来自主题: AI资讯

6314 点击 2026-05-27 16:53

Z Tech｜对话Andrew Dai：14年DeepMind生涯，见证PaLM到Gemini，下一站押注视觉推理

过去十年，大模型世界里很多最关键的技术路线背后，都能看到Andrew Dai的身影。从早期预训练与监督微调，到后来主流的MoE（Mixture of Experts）架构；从Google Brain最初只有几十人的研究时代，到后来支撑Gemini的大规模数据体系，这位在 Google 工作超过14年的研究科学家，几乎站在了大模型时代每一次关键转折的现场。

来自主题: AI资讯

9511 点击 2026-05-27 16:31

让大模型“边看边改”，视觉分割准确率直接上涨9% | ICML 2026

智能体时代，如何让视觉分割更准确？

来自主题: AI技术研报

9184 点击 2026-05-27 16:31

4万字《壮丽人性》长文首发！教皇联手Anthropic，警告AI不能统治人类

就在今天，教皇的首份AI通谕震撼发布，42300字宣言《壮丽人性》引人深思！Anthropic联创也绝望向教皇求助：大模型已经演化出恐惧与悲伤，人类实验室已经无法自我修正。

来自主题: AI资讯

10155 点击 2026-05-27 16:31