AI资讯新闻榜单内容搜索-模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型

微信炼出扩散语言模型，实现vLLM部署AR模型3倍加速，低熵场景超10倍

微信炼出扩散语言模型，实现vLLM部署AR模型3倍加速，低熵场景超10倍

微信炼出扩散语言模型，实现vLLM部署AR模型3倍加速，低熵场景超10倍

近日，腾讯微信 AI 团队提出了 WeDLM（WeChat Diffusion Language Model），这是首个在工业级推理引擎（vLLM）优化条件下，推理速度超越同等 AR 模型的扩散语言模型。

来自主题: AI技术研报

10447 点击 2026-01-03 13:56

「北京版幻方」九坤投资冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」九坤投资冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」九坤投资冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

又一个中国新模型被推到聚光灯下，刷屏国内外科技圈。IQuest-Coder-V1模型系列，看起来真的很牛。在最新版SWE-Bench Verified榜单中，40B参数版本的IQuest-Coder取得了81.4%的成绩，这个成绩甚至超过了Claude Opus-4.5和GPT-5.2（这俩模型没有官方资料，但外界普遍猜测参数规模在千亿-万亿级）。

来自主题: AI资讯

10304 点击 2026-01-02 15:14

系统学习Deep Research，这一篇综述就够了

系统学习Deep Research，这一篇综述就够了

系统学习Deep Research，这一篇综述就够了

近年来，大模型的应用正从对话与创意写作，走向更加开放、复杂的研究型问题。尽管以检索增强生成（RAG）为代表的方法缓解了知识获取瓶颈，但其静态的 “一次检索 + 一次生成” 范式，难以支撑多步推理与长期

来自主题: AI技术研报

8349 点击 2026-01-02 15:01

最新英伟达经济学：每美元性能是AMD的15倍，“买越多省越多”是真的

最新英伟达经济学：每美元性能是AMD的15倍，“买越多省越多”是真的

最新英伟达经济学：每美元性能是AMD的15倍，“买越多省越多”是真的

为什么AI算力霸主永远是英伟达？不算不知道，一算吓一跳：在英伟达平台每花一美元，获得的性能是AMD的15倍。

来自主题: AI资讯

9318 点击 2026-01-01 14:44

独家丨ListenHub完成200万美元融资，靠“自来水”做到ARR 300万美元进军北美

独家丨ListenHub完成200万美元融资，靠“自来水”做到ARR 300万美元进军北美

独家丨ListenHub完成200万美元融资，靠“自来水”做到ARR 300万美元进军北美

据我们独家获悉，ListenHub产品的母公司MarsWave完成了200万美元天使＋轮融资。本轮由天际资本领投，小米联合创始人王川跟投。同时，MarsWave也对外公布了盈利状况：目前公司年经常性收入（ARR）已突破300万美元，并达到月度盈亏平衡，成为少数已跑通盈利模型的AI原生公司。

来自主题: AI资讯

11092 点击 2026-01-01 10:19

超DeepEP两倍！无问芯穹FUSCO以「空中变阵」突破MoE通信瓶颈，专为Agent爆发设计

超DeepEP两倍！无问芯穹FUSCO以「空中变阵」突破MoE通信瓶颈，专为Agent爆发设计

超DeepEP两倍！无问芯穹FUSCO以「空中变阵」突破MoE通信瓶颈，专为Agent爆发设计

机器之心发布随着 ChatGPT、Gemini、DeepSeek-V3、Kimi-K2 等主流大模型纷纷采用混合专家架构（Mixture-of-Experts, MoE）及专家并行策略（Expert

来自主题: AI技术研报

9850 点击 2026-01-01 10:14

动态RAG性能提升14个点！用4万亿token教会大模型「什么时候该检索」

动态RAG性能提升14个点！用4万亿token教会大模型「什么时候该检索」

动态RAG性能提升14个点！用4万亿token教会大模型「什么时候该检索」

近日，来自伊利诺伊大学芝加哥分校、纽约大学、与蒙纳士大学的联合团队提出QuCo-RAG，首次跳出「从模型自己内部信号来评估不确定性」的思维定式，转而用预训练语料的客观统计来量化不确定性，

来自主题: AI技术研报

9322 点击 2026-01-01 10:13

「视频世界模型」新突破：AI连续生成5分钟，画面也不崩

「视频世界模型」新突破：AI连续生成5分钟，画面也不崩

「视频世界模型」新突破：AI连续生成5分钟，画面也不崩

围绕这一挑战，上海人工智能实验室联合复旦大学、南京大学、南洋理工大学 S-Lab 等单位提出了 LongVie 2—— 一个能够生成长达 5 分钟高保真、可控视频的世界模型框架。

来自主题: AI技术研报

9557 点击 2026-01-01 10:11

DeepMind内部视角揭秘！Scaling Law没死，算力即一切

DeepMind内部视角揭秘！Scaling Law没死，算力即一切

DeepMind内部视角揭秘！Scaling Law没死，算力即一切

2026年，Scaling Law是否还能继续玩下去？对于这个问题，一篇来自DeepMind华人研究员的万字长文在社交网络火了：Scaling Law没死！算力依然就是正义，AGI才刚刚上路。

来自主题: AI技术研报

9271 点击 2026-01-01 10:10

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

，时长 00:20 视频 1：单样例推理速度对比：SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)（注：NVIDIA 平台

来自主题: AI技术研报

8941 点击 2026-01-01 10:09

上一页当前第215页,共1161页下一页