AI资讯新闻榜单内容搜索-Odin

马斯克花 100 亿想清楚一件事，不做 coding agent 就是等死

OpenAI 的两大宿敌 Anthropic 和马斯克，放下心中成见之后终于在月初结盟了。

来自主题: AI资讯

7131 点击 2026-05-18 16:51

24小时从零写一个GBA模拟器！GPT-5.5跑出53分登顶，Gemini得了0.8分，底部还有两家交白卷

Mechanize 发布了一项硬核测试：给前沿 AI coding agents 24 小时，用 Rust 从零写一个完整的 Game Boy Advance 模拟器，再和顶级开源模拟器 Mesen2 逐帧对比打分。

来自主题: AI技术研报

7939 点击 2026-05-18 16:48

Need is all you need：AI接手Coding后，程序员最值钱的能力只剩这一项？

AI Coding的玩法，又变了。

来自主题: AI技术研报

9995 点击 2026-05-18 09:54

马斯克人在北京，xAI发布首款Coding Agent

没错，大洗牌之后，xAI紧锣密鼓地发上重磅新品了——首个Coding Agent，Grok Build。直接在终端运行、专为专业软件工程和复杂编程任务设计……对标的是谁，属于是摆在明面上的。

来自主题: AI资讯

9750 点击 2026-05-15 13:35

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8200 点击 2026-05-13 15:01

蚂蚁万亿参数思考模型Ring-2.6-1T来了！实测AIME真题难不倒，会写爽文、规划出行

今天，蚂蚁百灵大模型发布Ring-2.6-1T。这是一款面向真实复杂任务场景的万亿级思考模型，目前已上线OpenRouter，并开放限时一周免费体验，后续将正式开源。Ring-2.6-1T加入了可调节的Reasoning Effort机制。开发者可以在high和xhigh两种推理强度之间选择：high面向Agent、Coding、多步工具调用等高频任务

来自主题: AI资讯

9323 点击 2026-05-09 21:30

我 Skill 化了耿同学的「学术打假方法论」，致敬

我一直全程关注他打假的全过程，也一直有个想法：耿同学做的这些，能不能让 AI 分担一部分？这几天我琢磨了很久，也 Vibe Coding 了很久，最后做出来一个初版的「学术打假 Skill——research-integrity-auditor」。

来自主题: AI资讯

10150 点击 2026-05-08 11:54

TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文

随着代码智能从 code foundation models 走向 autonomous coding agents，CLI/terminal 正在成为智能体进入真实软件工程工作流的重要入口。

来自主题: AI技术研报

5526 点击 2026-05-07 15:03

“DeepSeek版Claude Code”，Github 2.3k星

DeepSeek也有自己专属的Coding Agent了。名字简单粗暴，就叫DeepSeek-TUI，作者自称是一名“鲸鱼兄弟”的DeepSeek爱好者。刚刚，这个项目的星标数突然开始骤增，来到了2.3k，还登上了GitHub热榜。

来自主题: AI资讯

8782 点击 2026-05-04 13:23

苹果官方App误打包了Claude.md，这么大的公司也Vibe Coding啊？

苹果大失误！把自用的Claude.md打包到了官方App里。这下直接被坐实了：苹果内部在使用Claude Code构建生产级应用。这么大的公司，也在Vibe Coding？

来自主题: AI资讯

7844 点击 2026-05-02 11:02