AI资讯新闻榜单内容搜索-不

一个模型超了DeepSeek R1、V3，参数671B，成本不到350万美元

Deep Cogito，一家鲜为人知的 AI 初创公司，总部位于旧金山，由前谷歌员工创立，如今开源的四款混合推理模型，受到大家广泛关注。

来自主题: AI资讯

8044 点击 2025-08-02 13:38

AI答IMO难题坦承“不会”，OpenAI：这就是自我意识

这一次，“不会”竟成了大模型的高光时刻。虽然在IMO第6题上得了零分，OpenAI的金牌模型却展现了“高智商的诚实”。

来自主题: AI资讯

6866 点击 2025-08-02 13:32

用 AI 生图的外卖店，我劝你别点

每次和我妈打电话，她都会不可避免地提一嘴：「少吃点外卖。」以前我觉得这是典型中年父母的唠叨，不太了解年轻人的生活方式。现在我懂了，她才是早就看穿一切的预言家。

来自主题: AI资讯

8914 点击 2025-08-02 13:28

机器人不只会抓和放！北京大学X银河通用「世界-动作模型」赋能全面泛化的非抓握技能

尽管当前的机器人视觉语言操作模型（VLA）展现出一定的泛化能力，但其操作模式仍以准静态的抓取与放置（pick-and-place）为主。相比之下，人类在操作物体时常常采用推动、翻转等更加灵活的方式。若机器人仅掌握抓取，将难以应对现实环境中的复杂任务。

来自主题: AI技术研报

8229 点击 2025-08-02 13:19

港科大发布「大模型越狱攻击」评估基准，覆盖37种、6大类别方法

现有的方法对大语言模型（LLM）「越狱」攻击评估存在误判和不一致问题。港科大团队提出了GuidedBench评估框架，通过为每个有害问题制定详细评分指南，显著降低了误判率，揭示了越狱攻击的真实成功率远低于此前估计，并为未来研究提供了更可靠的评估标准。

来自主题: AI技术研报

7984 点击 2025-08-02 13:15

你的Prompt已达性能极限？试试这个0成本的优化 | 马里兰大学最新

上下文学习（In-Context Learning, ICL）、few-shot，经常看我文章的朋友几乎没有人不知道这些概念，给模型几个例子（Demos），它就能更好地理解我们的意图。但问题来了，当您精心挑选了例子、优化了顺序，结果模型的表现还是像开“盲盒”一样时……有没有可能，问题出在一个我们谁都没太在意的地方，这些例子，到底应该放在Prompt的哪个位置？

来自主题: AI资讯

7511 点击 2025-08-02 12:37

Manus AI 上线以来最大更新：100 个 Agent 为你打工，但缺点是太烧钱了

一个 Agent（智能体）不够用？Manus 干脆给你拉来 100 个。今天凌晨，Manus 推出了一项新功能：Manus Wide Research。这项功能的核心亮点在于，用户只需一键即可开启大规模并行 Agent 协作，轻松处理原本需要耗费数小时、动用数百个数据源的复杂调研任务。

来自主题: AI资讯

8442 点击 2025-08-01 16:51

全球首款通用AI科研智能体问世：我一个文科生用它写了份CRISPR基因编辑综述报告

就在一夜之间，用 AI 帮忙搞科研，不是再只是想想了。最近，科研圈里越来越多的人在讨论一种叫 SciMaster 的「AI 科学助手」，有让它做实验的，有让他帮忙开题的，还有跟他聊科幻的。

来自主题: AI技术研报

9754 点击 2025-08-01 16:33

字节Seed发布扩散语言模型，推理速度达2146 tokens/s，比同规模自回归快5.4倍

用扩散模型写代码，不仅像开了倍速，改起来还特别灵活！字节Seed最新发布扩散语言模型Seed Diffusion Preview，这款模型主要聚焦于代码生成领域，它的特别之处在于采用了离散状态扩散技术，在推理速度上表现出色。

来自主题: AI资讯

8185 点击 2025-08-01 16:04

又一SOTA级开源模型！阶跃Step-3多模态推理登顶，百万token解码成本不到4毛钱

又一个SOTA基础模型开源，而且依然是国产。刚刚，阶跃星辰兑现了WAIC上的承诺，将最新多模态推理模型Step-3正式开源！在MMMU等多个多模态榜单上，它一现身就取得了开源多模态推理模型新SOTA的成绩。

来自主题: AI技术研报

8977 点击 2025-08-01 12:52