AI资讯新闻榜单内容搜索-模型

让AI智能体「记住」失败经验：微软提出Re-TRAC框架，4B性能SOTA，30B超越358B

来自东南大学、微软亚洲研究院等机构的研究团队提出了一种全新的解决方案——Re-TRAC（REcursive TRAjectory Compression），这个框架让 AI 智能体能够「记住」每次探索的经验，在多个探索轨迹之间传递经验，实现渐进式的智能搜索。

来自主题: AI技术研报

9593 点击 2026-02-25 10:35

Anthropic指控中国大模型“使诈”，马斯克凶猛炮轰，海外网友贴脸开骂

今天，美国大模型独角兽Anthropic连续发布多则推文、博客，指控DeepSeek、月之暗面和MiniMax三家中国AI实验室，正对Claude进行“工业级规模的蒸馏攻击”。

来自主题: AI资讯

8909 点击 2026-02-24 18:59

jina-embeddings-v5-text：0.6B 参数下最好的多语言向量模型

jina-embeddings-v5-text 岁在丙午，开年即战。Jina AI 的五代目向量模型春节期间正式发布。1B 参数内世界第一，全面刷新向量模型的性能天花板！

来自主题: AI技术研报

9064 点击 2026-02-24 15:43

多模态DeepResearch，成了！

DeepResearch 的价值在于把「查资料」变成「做研究」：不是搜到一条就回答，而是会连续多轮地提出问题、去不同地方找证据、互相对照核实、再把信息整理成结构清晰的结论。这样做能显著降低「凭感觉瞎编

来自主题: AI技术研报

8001 点击 2026-02-24 15:41

Kimi春节档挣超一年钱！这口“龙虾肉”大厂开始抢吃了

好好好，年刚过完，「龙虾肉」就先被Kimi夹走了一口。一周前刚上线支持一键部署的Kimi Claw，转头就在OpenClaw模型调用榜上冲到TOP1。Kimi近20天的收入，直接卷过去年全年，估值一路飙至700亿元。

来自主题: AI资讯

9608 点击 2026-02-24 15:39

字节Seed用化学思想搞AI，把DeepSeek-R1的脑回路拆成了分子结构

字节Seed都开始用化学思想搞大模型了——深度推理是共价键、自我反思是氢键、自我探索是范德华力？！

来自主题: AI技术研报

9783 点击 2026-02-24 15:37

大模型真听懂了吗？最全综合性口语感知与推理基准 | ICLR'26

随着多模态大模型能力不断扩展，语音大模型(SpeechLLMs) 已从语音识别走向复杂语音交互。然而，当模型逐渐进入真实口语交互场景，一个更基础的问题浮现出来：我们是否真正定义清楚了「语音理解」的能力边界？

来自主题: AI技术研报

10381 点击 2026-02-24 15:35

花21000块钱，测34205条主流大模型用例，结论免费给你

春节闭关五天，我做了个东西：一个大模型场景化测评平台。35000+ 次模型跑测，一共 42+ 模型，11,000 块人民币。我全部跑完了，结论汇成一个平台，还会持续更新。

来自主题: AI产品测评

9035 点击 2026-02-24 15:31

ICLR 2026 | 数据缺少标注，RL还能稳定诱导模型推理吗？Co-rewarding提供自监督RL学习方案！

针对这一挑战，来自香港浸会大学和上海交通大学的可信机器学习和推理组提出了一个全新的自监督 RL 框架 ——Co-rewarding。该框架通过在数据端或模型端引入互补视角的自监督信号，稳定奖励获取，提升 RL 过程中模型奖励投机的难度，从而有效避免 RL 训练崩溃，实现稳定训练和模型推理能力的诱导。

来自主题: AI技术研报

8250 点击 2026-02-24 15:16

刚刚，Anthropic深夜大点名，这三家中国公司进行蒸馏攻击？！

刚刚， Anthropic 发推称，DeepSeek、Moonshot AI和MiniMax三家国内的 AI 公司对Claude进行大规模的蒸馏攻击。OK， A 社你真的很讨厌中国公司了。简单说就是：这三家公司用大量假账号，疯狂地向 Claude 提问，然后拿 Claude 的回答去训练自己的模型。

来自主题: AI资讯

9280 点击 2026-02-24 09:17