降维打击!数学博士熬秃头,AI数学家:上午出题,下午4点交证明
降维打击!数学博士熬秃头,AI数学家:上午出题,下午4点交证明自今年2月以来,AxiomProver已让8篇覆盖最硬核领域的AI论文现身arXiv,6篇正在筹备。上午出题下午交卷的节奏,让博士生秃头、教授评职称的日子一去不复返。接下来AI能做到什么?
搜索
自今年2月以来,AxiomProver已让8篇覆盖最硬核领域的AI论文现身arXiv,6篇正在筹备。上午出题下午交卷的节奏,让博士生秃头、教授评职称的日子一去不复返。接下来AI能做到什么?
要说这段时间的热门 AI 产品,Codex 必然是绕不过去的话题。
多智能体协作对于解决复杂问题虽然具有巨大优势,但是其架构本质上易出现错误传播,因为由不正确的工作流生成或单智能体幻觉输出引起的错误会沿着协作链蔓延,影响最终结果。
很多人说,在 AI 时代,品味是人类最后的护城河。但 Boris Cherny 不这么认为。
一年前,行业还在为“从自动补全到 Agent”的进化感到兴奋。然而一年过去,我们不难发现单纯靠“Vibe Coding”和“Prompt 调优”,面对非确定性模型带来的风险和成本问题,显然无法撑起企业级软件开发。
三大 AI 实验室不约而同招经济学家。DeepMind 新设的「AGI 经济学」部门给出了第一批判断,比「AI 会取代你」要深得多,也扎心得多。
最近Max Leiter写了一篇文章《它们是权重做的》:https://maxleiter.com/blog/weights 专门用来调侃大模型,我看了以后,觉得虽然有趣,但是不太符合国人的阅读习惯,就重新写了一遍,希望大家喜欢。
6月8日,高德重磅发布了全球首个3D原生城市世界模型——ABot-Earth0.5。ABot-Earth0.5的发布不仅宣告着城市级场景3D原生技术的重要突破,更彻底重塑了传统3D建模的生产逻辑与成本结构。
过去两年,“AI 游戏”很大程度上还停留在一键生成 Demo 阶段:输入一句提示词,几秒钟生成一个能试玩几分钟的小作品,适合传播和展示模型能力,但很难留下真正的玩家和商业化结果。
不扩上下文窗口、不换骨干架构、不做全参数微调 —— 只需要一个 8×8 的在线状态矩阵,就能让冻结的 Transformer 拥有真正的长期记忆。