AI资讯新闻榜单内容搜索-模型

清华一作1B暴打405B巨无霸，7B逆袭DeepSeek R1！测试时Scaling封神

【新智元导读】仅凭测试时Scaling，1B模型竟完胜405B！多机构联手巧妙应用计算最优TTS策略，不仅0.5B模型在数学任务上碾压GPT-4o，7B模型更是力压o1、DeepSeek R1这样的顶尖选手。

来自主题: AI技术研报

9066 点击 2025-02-13 14:18

这应该是我知道的第一家有自己大模型的大厂，第一次在面向C端的AI助手应用中，第一次接入DeepSeek R1。这个意义影响还是非常深远的，腾讯在AI这一步上，好像走的格外的开放，从之前的批量开源MoE、混元绘图模型、混元视频模型、混元3D模型，还有今天这神之一手接入DeepSeek R1。

来自主题: AI资讯

10853 点击 2025-02-13 13:31

多模态大模型理解真实世界的水平到底如何？

来自主题: AI技术研报

6463 点击 2025-02-13 09:49

最近，全球科技行业的焦点无疑落在了DeepSeek引发的热潮之上。几乎在一夜之间，全球市场对中国AI大模型及其相关产业的态度发生了180度转变——从此前的“过度悲观”瞬间跳跃至“极度乐观”，2025也似乎成为中美AI对决元年。

来自主题: AI资讯

7943 点击 2025-02-12 20:36

DeepSeek 最近的爆火程度令人咋舌。短短20天内用户量就突破3000万，导致官方服务器几乎天天处于过载状态。虽然市面上已经涌现出不少第三方接入平台，但这些平台大多针对个人用户，对开发者和企业的需求难以满足。

来自主题: AI资讯

8275 点击 2025-02-12 20:27

还在用枯燥的数学题和编程题测试AI？落伍啦！现在，打游戏就能测出AI的真实力。GameArena团队打造的Roblox新游《AI空间逃脱》，让你在紧张刺激的密室逃脱中，顺便就把AI模型的推理能力给评估了。这不仅比传统测试方法更有趣，还能生成宝贵的游戏数据，帮助开发者更全面地了解AI的强项与短板。

来自主题: AI资讯

10664 点击 2025-02-12 17:08

开源推理大模型新架构来了，采用与Deepseek-R1/OpenAI o1截然不同的路线：抛弃长思维链和人类的语言，直接在连续的高维潜空间用隐藏状态推理，可自适应地花费更多计算来思考更长时间。

来自主题: AI技术研报

7873 点击 2025-02-12 16:42

这一篇文章来源于我自己的困惑而进行的探索和思考，再进行多次讨论后总觉隔靴搔痒，理解不透彻。而在我自己整理后，发现已经有小伙伴点明了他们的区别。但是因为了解深度的不够，即使告诉了答案，我也无法理解，总有隔靴搔痒之感。

来自主题: AI技术研报

10505 点击 2025-02-12 16:26

复旦新研究揭示了AI系统自我复制的突破性进展，表明当前的LLM已具备在没有人类干预的情况下自我克隆的能力。这不仅是AI超越人类的一大步，也为「流氓AI」埋下了隐患，带来前所未有的安全风险。

来自主题: AI技术研报

7446 点击 2025-02-12 12:05

人类通过课堂学习知识，并在实践中不断应用与创新。那么，多模态大模型（LMMs）能通过观看视频实现「课堂学习」吗？新加坡南洋理工大学S-Lab团队推出了Video-MMMU——全球首个评测视频知识获取能力的数据集，为AI迈向更高效的知识获取与应用开辟了新路径。

来自主题: AI技术研报

7805 点击 2025-02-12 12:01