AI资讯新闻榜单内容搜索-大模

推理模型新路线开源！与DeepSeek截然不同，抛弃思维链不用人类语言思考

开源推理大模型新架构来了，采用与Deepseek-R1/OpenAI o1截然不同的路线：抛弃长思维链和人类的语言，直接在连续的高维潜空间用隐藏状态推理，可自适应地花费更多计算来思考更长时间。

来自主题: AI技术研报

7527 点击 2025-02-12 16:42

人类通过课堂学习知识，并在实践中不断应用与创新。那么，多模态大模型（LMMs）能通过观看视频实现「课堂学习」吗？新加坡南洋理工大学S-Lab团队推出了Video-MMMU——全球首个评测视频知识获取能力的数据集，为AI迈向更高效的知识获取与应用开辟了新路径。

来自主题: AI技术研报

7394 点击 2025-02-12 12:01

DeepSeek的爆火，让AI大模型在新一年的开年，又一次引起了全球的关注。然而，时至今日全球AI领域还没有完全消化DeepSeek带来的实质影响——这样的模式将给全球、给中国AI领域带来什么样的变局？

来自主题: AI资讯

6883 点击 2025-02-12 11:47

字节出了个全新架构，把推理成本给狠狠地打了下去！推理速度相比MoE架构提升2-6倍，推理成本最高可降低83%。

来自主题: AI技术研报

7854 点击 2025-02-12 11:37

先是三星宣布智谱的Agentic GLM成为其新手机Galaxy S25的AI能力来源，紧接着The Information爆料，在经历了近一年的模型测试与合作伙伴探索后，苹果终于敲定了中国市场的合作伙伴：阿里巴巴。这意味着，中国iPhone用户很可能在今年迎来一个由国产大模型驱动的iPhone。

来自主题: AI资讯

10731 点击 2025-02-12 10:57

科技公司、车企或者是新消费企业，一时间都宣布接入DeepSeekR1大模型。DeepSeek，成了当下的“AI显学”。网易有道、学而思、云学堂行业里做软件的，做内容的，做平台的都宣布接入DeepSeek大模型。

来自主题: AI资讯

7616 点击 2025-02-12 10:34

还在为 DeepSeek R1 官网的卡顿抓狂？无问芯穹大模型服务平台现已上线满血版 DeepSeek-R1、V3，无需邀请即可免费用 Token！另有异构算力鼎力相助，支持通过 Infini-AI 异构云平台一键获取 DeepSeek 系列模型与多元异构自主算力服务。

来自主题: AI资讯

9335 点击 2025-02-11 14:56

DeepSeek 在海内外搅起的惊涛巨浪，余波仍在汹涌。当中国大模型撕开硅谷的防线之后，在预设中总是落后半拍的中国 AI 军团，这次竟完成了一次反向技术输出，引发了全球范围内复现 DeepSeek 的热潮。

来自主题: AI技术研报

7504 点击 2025-02-11 14:52

一篇报道，在AI圈掀起轩然大波。文中引用了近2年前的论文直击大模型死穴——Transformer触及天花板，却引来OpenAI研究科学家的紧急回应。谁能想到，一篇于2023年发表的LLM论文，竟然在一年半之后又「火」了。

来自主题: AI技术研报

6910 点击 2025-02-11 14:16

众所周知，由各类大模型驱动的生成式AI功能，如今已经相当高调地出现在了各大消费电子产品厂商的宣传中。而对于消费者来说，生成式AI的“实际价值”除了对话、问答，以及部分生产力场景可能有用的内容总结、归纳之外，最能被大家广泛接受的，恐怕还是将其用在影像处理领域的各种“生成式拍照”和“修图”功能。

来自主题: AI资讯

7120 点击 2025-02-11 11:04