AI资讯新闻榜单内容搜索-GE

大模型也需要睡觉！让AI打个盹，醒来更聪明

7×24，AI也吃不消。

来自主题: AI技术研报

7788 点击 2026-05-29 09:19

刚刚，DeepSeek陈德里与两个AI，合写了一篇论文

「借助 CodeAgent，我终于可以重新捡起很多过去因为精力不足而搁置的事情了，写博客就是其中之一。这篇博客大概 1% 是我写的，99% 是 Agent 写的 😂」。

来自主题: AI技术研报

7104 点击 2026-05-29 09:19

刚刚，Claude Opus 4.8来了！两个史上首次改写历史

Opus 4.7发布刚43天，Opus 4.8就来了！编程实力暴增，全面霸榜。Claude Code一口气放出上百个agent并行干活，一个人11天就能重写75万行代码、99.8%测试通过。更狠的Claude Mythos，几周后就来。

来自主题: AI资讯

9276 点击 2026-05-29 09:00

GPT-5.5翻倍，Gemini涨3倍：这波涨价游戏还能玩多久？

Epoch AI刚刚发布的《梯度更新》报告，做了一件简单粗暴的事：把全球所有Blackwell芯片能处理的Token数量算出来，再和实际需求一比。结论只有一个字——不够。

来自主题: AI技术研报

8672 点击 2026-05-28 20:59

面壁智能开源Agent神器PilotDeck，让Token成本狂降70%！

刚刚，清华团队开源硬核Agent系统PilotDeck，在开发者圈已经传疯了。项目独立建舱，记忆可视可改，Token还能省一大半。从此，一个人，就是一支AI军团！

来自主题: AI资讯

6209 点击 2026-05-28 15:14

[翻译] AI Agent 的 Zero Trust 框架｜Anthropic 安全白皮书

Zero Trust 是一套安全架构，核心前提很简单：不信任任何东西，必须验证一切

来自主题: AI资讯

8812 点击 2026-05-28 15:12

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力，看Qwen3.7 Max 是否实至名归？！

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro，阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名，仅次于 Claude Opus 4.7。除了真实场景的用户选择，在传统的大模型固定评测榜单上，像是终端能力 Terminal Bench、编程能力 SWE Bench 等，Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评

9923 点击 2026-05-28 12:06