正面硬刚Claude Opus 4.6:我们给GLM-5.1使了三个“绊子”,它居然…
正面硬刚Claude Opus 4.6:我们给GLM-5.1使了三个“绊子”,它居然…今天,智谱正式开源其最强模型GLM-5.1,这一模型在专业软件开发基准测试SWE-Bench Pro中,GLM-5.1刷新全球最佳成绩,得分达到58.4,超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型,和MiniMax M2.7、Kimi K2.5等开源模型。
搜索
今天,智谱正式开源其最强模型GLM-5.1,这一模型在专业软件开发基准测试SWE-Bench Pro中,GLM-5.1刷新全球最佳成绩,得分达到58.4,超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型,和MiniMax M2.7、Kimi K2.5等开源模型。
刚刚,深圳机器人芯片公司地瓜机器人宣布拿下1.5亿美元(约合人民币10.24亿元)B2轮新融资,某零售科技与供应链巨头、滴滴、Prosperity7风投基金、高瓴创投、淡马锡旗下Vertex Growth、五源资本等产业巨头及一线资本参投。
AI圈的节奏已经快到让人产生幻觉了。
Claude Code 负责人 Boris Cherny 最近可能很头疼,因为这款神级 AI 在快速更新的同时被曝出各种问题。
LangChain 只换了模型外面的基础设施——同一个模型、同一套权重——就从 TerminalBench 2.0 排行榜 30 名开外直接跳到了第 5 名。另一个独立研究项目让大模型自己优化这层基础设施,达到了 76.4% 的通过率,超过了所有人工设计的方案。
信息无损Token最高节省87%,一款省Token神器正在GitHub蹿红。
今天,Anthropic又出了一条引爆AI圈的新闻:年化收入已经超过了OpenAI,达到了300亿美元!
在官方仓库贴脸开大,热议Issue指出:Claude Code已经更新“废了”。某次更新让思考深度下降67%,当前版本已无法胜任复杂工程任务。“无视用户指令”“执行与用户要求完全相反的操作”“假装说任务已完成”……模型行为全面走样。
Ilya偷拍备份的OpenAI机密文件,刚刚曝光。
今天《纽约客》发表了历时 18 个月的调查报道,首次披露 OpenAI 首席科学家 Ilya Sutskever 在 2023 年秋天汇编的 70 页内部备忘录,以及 Anthropic 联合创始人 Dario Amodei 保留多年的 200 余页私人笔记。