Anthropic被曝造芯!挖OpenAI老兵,密谈三星2nm
Anthropic被曝造芯!挖OpenAI老兵,密谈三星2nm刚刚,The Information爆出:Anthropic已启动自研AI芯片的早期工作,并与三星电子讨论潜在的代工合作。据知情人士称,考虑中的选项包括三星的2nm制程和先进封装。
搜索
刚刚,The Information爆出:Anthropic已启动自研AI芯片的早期工作,并与三星电子讨论潜在的代工合作。据知情人士称,考虑中的选项包括三星的2nm制程和先进封装。
刚刚,纽约大学联合LeCun初创AMI带来JEPA系列的最新成果——AdaJEPA。与过去在预训练结束后就冻结参数的世界模型不同,AdaJEPA能够在与环境交互中,基于测试时自适应(Test-Time Adaptation, TTA),实时调整世界模型的编码器和预测器参数,从而实现持续学习。
具身智能正在进入数据 scaling 时代。Vision-Language-Action(VLA)模型让机器人可以从大规模示教数据(demonstrations)中学习更通用的操作策略。但对机器人 VLA 训练来说,数据并不总是越多越好:低质量数据可能会拖累模型性能,而每一条 demonstration 都意味着昂贵的人力采集、机器人运行,以及云端存储和训练成本。
最近硅谷最火的岗位,非FDE莫属。FDE全称“Forward Deployment Engineer”,可以直接翻译成“前线部署工程师”。他们既要懂模型和技术,也要理解客户的数据、流程和业务痛点,核心任务是把AI从demo变成各个职业自己的AI-native工作流。
据外媒 The Information 报道:Meta 正在限制员工在 AI 模型构建中使用 Claude Code 和 Codex,原因是担心涉及模型蒸馏。 Meta 担心这些外部模型生成的内容,可能进入自家的训练数据或评测体系,从而引发所谓的模型蒸馏争议。
刚刚,DeepSeek V4 进行了一次更新。新推出了投机解码(Speculative Decoding)框架 DSpark,并同步开源了支撑该版本的全栈推测性解码框架 DeepSpec。DeepSeek-V4-Pro-DSpark 并非全新架构模型,而是在 DeepSeek-V4-Pro 基础上引入了推测性解码模块。此次更新的重点在于工程落地,而非模型能力本身的迭代。
带着这份遗憾与使命,Nico 创立了 AI 医疗平台 Telepatia。近日,该公司正式宣布完成 3300 万美元的 A 轮融资。值得瞩目的是,本轮融资由全球顶级风投巨头 a16z(Andreessen Horowitz)强势领投。
微软CEO 萨蒂亚·纳德拉,上周发的那篇《没有生态的前沿,立不住》(A frontier without an ecosystem is not stable),是近期挺有意思的一篇文章。不在于它提出了多少新概念,里面的很多要点,在近一年里大多已有讨论,而在于说它的不是旁观者,而是亲手运营着庞大 AI 基础设施的人,并且纳德拉用很朴素的语言,把两件非常重要的事情讲清楚了:
过去十年,推荐系统最核心的动作可以概括成一个字:找。
全球最强超算,易主了!