AI资讯新闻榜单内容搜索-大模型

人大刘勇团队「慢思考」机理分析：从雪球误差到正确推理概率

「慢思考」（Slow-Thinking），也被称为测试时扩展（Test-Time Scaling），成为提升 LLM 推理能力的新方向。近年来，OpenAI 的 o1 [4]、DeepSeek 的 R1 [5] 以及 Qwen 的 QwQ [6] 等顶尖推理大模型的发布，进一步印证了推理过程的扩展是优化 LLM 逻辑能力的有效路径。

来自主题: AI技术研报

6828 点击 2025-02-10 17:04

诺奖得主DeepMind CEO放话：DeepSeek是中国最好AI模型，但没任何科学进步

xAI、谷歌DeepMind和Anthropic的CEO们纷纷对DeepSeek的技术创新性提出质疑，认为其并未带来实质性的科学突破。AI大佬纷纷泼冷水，到底是技术讨论还是各怀目的？

来自主题: AI资讯

9208 点击 2025-02-10 16:50

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

就在刚刚，AIME 2025 I数学竞赛的大模型参赛结果出炉，o3-mini取得78%的最好成绩，DeepSeek R1拿到了65%，取得第四名。然而一位教授却发现，某些1.5B小模型竟也能拿到50%，莫非真的存在数据集污染？

来自主题: AI资讯

10358 点击 2025-02-10 11:21

图像生成推理大模型，港中文北大等联手破解画质提升难题

图像生成模型，也用上思维链（CoT）了！此外，作者还提出了两种专门针对该任务的新型奖励模型——潜力评估奖励模型。（Potential Assessment Reward Model，PARM）及其增强版本PARM++。

来自主题: AI技术研报

7043 点击 2025-02-10 11:09

车企抢抱DeepSeek大腿，中国车企要靠AI“换道超车”？

当ChatGPT用对话颠覆人机交互时，车企们早已嗅到了AI大模型的潜力——从语音助手到自动驾驶，从情感陪伴到场景决策，智能座舱的体验边界正被重新定义。

来自主题: AI资讯

10589 点击 2025-02-10 11:04

DeepSeek爆火，国内同行度过了一个痛苦的春节

DeepSeek让国内一众大模型同行度过了一个“痛苦”的春节。年前，DeepSeek掀起AI海啸，有某大厂大模型业者就捶胸顿足：“产品超出了我的想象，比咱家的各方面都好，真想跳槽到DeepSeek。”还有很多人反思，为啥咱自家就没做出DeepSeek。也有业者不服气，认为“它的火只是一种情绪的泡沫。”

来自主题: AI资讯

7533 点击 2025-02-09 09:48

奥特曼再谈DeepSeek：肯定开源模型巨大贡献，坚信人类终将实现AGI

在柏林工业大学的一场圆桌对话当中，奥特曼再一次谈到了DeepSeek，并大赞开源模型对世界的贡献。对话中，奥特曼还发表了对AGI的最新看法，透露了十足的信心，他认为，虽然会遇到阻碍和挑战，但他相信人类终将实现AGI。

来自主题: AI资讯

10423 点击 2025-02-09 09:16

腾讯云X DeepSeek：API调用+联网搜索，分钟打造企业级 AI 应用

刚刚，腾讯云再放大招——不仅上线了 DeepSeek-R1 和 V3 原版模型的 API 接口，还将它们接入了大模型知识引擎，并支持联网搜索，成为国内率先实现这一能力的云厂商。

来自主题: AI资讯

9038 点击 2025-02-08 17:25

朱啸虎态度180度大反转，大喊“我肯定会投deepseek“！

“我肯定会投啊！我肯定会投！——这个价格已经不太重要了，关键是参与在这里面。”1年前，2024年初，在我们关于《朱啸虎讲了一个中国现实主义AIGC故事》的报道中，朱啸虎的观点淋漓尽致地展现了一个现实版中国AI故事。他用“我们一看就知道，这个肯定没戏”，“我们一开始就说了，我就不看好大模型”，“ 我都不愿意去聊，你知道吗？这没有意义”，表态绝不会投资6家中国大模型创业公司中的任何一家。

来自主题: AI资讯

10486 点击 2025-02-08 14:38

浙大&通义全面评测智能体复杂任务规划能力，18主流大模型全不及格｜ICLR2025

在处理这类复杂任务的过程中，大模型智能体将问题分解为可执行的工作流（Workflow）是关键的一步。然而，这一核心能力目前缺乏完善的评测基准。为解决上述问题，浙大通义联合发布WorfBench——一个涵盖多场景和复杂图结构工作流的统一基准，以及WorfEval——一套系统性评估协议，通过子序列和子图匹配算法精准量化大模型生成工作流的能力。

来自主题: AI技术研报

9188 点击 2025-02-08 13:19