谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了
谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了弹性 AI 预训练已经推进到了下一个前沿!没有意外:来自谷歌。据介绍,他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术,能够利用全球各地的异构硬件进行训练,并且即使当硬件发生故障时,系统也不会停止运行!
搜索
弹性 AI 预训练已经推进到了下一个前沿!没有意外:来自谷歌。据介绍,他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术,能够利用全球各地的异构硬件进行训练,并且即使当硬件发生故障时,系统也不会停止运行!
欢迎大家尝试前不久GitHub的日榜榜首项目——Claude Context。通过在AI coding场景引入混合检索,Claude Context相比使用grep的原生 Claude Code 能大幅提升检索精度和效率,减少约 40% 的 不必要Token 消耗。
谷歌豪掷400亿美元加注Anthropic,自家Gemini正面对垒的「敌人」。当Claude年化收入一年暴涨30倍冲到300亿,当算力成为AI下半场唯一硬通货,与其用Gemini硬刚,不如把对手变成TPU最大买家。
就在今天,AI机器人初创Medra正式发布美国规模最大的AI全自动自主实验室ML001。这座实验室不到90天建成,占地3.8万平方英尺,配备数百台机器人,全天候不间断运行。
OpenAI向全美医生免费开放临床版ChatGPT,功能直指转诊信、保险预授权、病历文书,但医生必须得先证明自己真是医生才能入场。OpenAI这波操作,是要直接抢占全美医生的桌面。
今天上午,DeepSeek V4 发布,直接把这个大模型疯狂更新月推向了最高潮。不过在我翻看 V4 的技术报告的时候,在训练层面看到了一个被大部分人滑过去的名词:Muon 优化器。
Cognichip正在构建一个深度学习模型,以便在工程师设计新计算机芯片的过程中为其提供协助。它试图解决的问题是该行业数十年来一直面临的一个难题:芯片设计极其复杂、成本高昂且速度缓慢。先进的芯片从概念设计到大规模生产需要三到五年的时间;仅设计阶段就可能长达两年。想想看,英伟达最新的 GPU 系列Blackwell就包含1040 亿个晶体管——要排列这么多晶体管可不是一件容易的事。
「前方智能」从知情人士处获悉,国内大模型独角兽「阶跃星辰」计划发布首款一方AI手机,最快或于今年8月正式亮相。为此,阶跃星辰还吸引了来自魅族科技、荣耀公司不少团队成员。
Era平台允许硬件制造商为 AI 设备创建 AI 智能体和编排。该公司并不打算自己制造设备,而是旨在通过提供一个软件层来赋能他人,该软件层可以处理诸如定制语音创建或为耳机等传统设备添加智能等任务。
能陪聊,能干活,还能提供情绪价值。这个抱着AI小猫的女孩叫SUSU,她们都来自AI初创公司SentiPulse思维光谱自主研发的AI Agent产品——SentiCat。SentiCat拥有三大核心能力:办公自动化、深度研究、代码开发。不管是写报告、做PPT,还是帮你写代码、找bug,都不在话下。