围绕开店和外卖,美团一口气发布三个智能助手,AI投入已达百亿
围绕开店和外卖,美团一口气发布三个智能助手,AI投入已达百亿从C端的小美,到B端的“袋鼠参谋”、“袋鼠管家”和“智能管家”,美团已经作出了一个“AI助手”矩阵。未来,这些AI助手之间如何配合和协作,形成一个新的AI原生生态,充满了想象、但也充满了挑战。
从C端的小美,到B端的“袋鼠参谋”、“袋鼠管家”和“智能管家”,美团已经作出了一个“AI助手”矩阵。未来,这些AI助手之间如何配合和协作,形成一个新的AI原生生态,充满了想象、但也充满了挑战。
哪些团队在真正积极拥抱 AI,而哪些团队还在偷偷“躲避”。
AI模型是现在,Physical AI是未来
AI写作暂时难堪大用+球迷受众对AI创作的天然警惕,才是体育记者继续守住业务地盘的根本。
恶搞也要有底线!
Poolside 是一家 AI 编程初创公司,其首款产品问世仅一年。该公司正与 CoreWeave 合作开发全美规模最大的数据中心之一,这标志着人工智能基础设施投资热潮的最新动向。
多模态大模型首次实现像素级推理,指代、分割、推理三大任务一网打尽!
大模型强化学习总是「用力过猛」?Scale AI联合UCLA、芝加哥大学的研究团队提出了一种基于评分准则(rubric)的奖励建模新方法,从理论和实验两个维度证明:要想让大模型对齐效果好,关键在于准确区分「优秀」和「卓越」的回答。这项研究不仅揭示了奖励过度优化的根源,还提供了实用的解决方案。
近期,扩散语言模型备受瞩目,提供了一种不同于自回归模型的文本生成解决方案。为使模型能够在生成过程中持续修正与优化中间结果,西湖大学 MAPLE 实验室齐国君教授团队成功训练了具有「再掩码」能力的扩散语言模型(Remasking-enabled Diffusion Language Model, RemeDi 9B)。
在 AI 发展的新阶段,大模型不再局限于静态知识,而是可以通过「Search Agent」的形式实时连接互联网。搜索工具让模型突破了训练时间的限制,但它们返回的并非总是高质量的资料:一个低质量网页、一条虚假消息,甚至是暗藏诱导的提示,都可能在用户毫无察觉的情况下被模型「采纳」,进而生成带有风险的回答。
在多模态大模型的后训练浪潮中,强化学习驱动的范式已成为提升模型推理与通用能力的关键方向。
李飞飞的世界模型创业,最新成果来了!刚刚,教母亲自宣布对外推出全新模型RTFM(A Real-Time Frame Model),不仅具备实时运行、持久性和3D一致性,更关键的是——单张H100 GPU就能跑。
Reve AI 是一家 2023 年 12 月才建立的加州 AI 初创公司,他们在 2025 年 3 月推出了第一个生图模型叫 Reve Image 1.0,内部代号是「Halfmoon」。6 个月过后,再次升级该模型为「图像编辑模型」。
他们又推出了 Coral NPU,可用于构建在低功率设备上持续运行的 AI。具体来说,其可在可穿戴设备上运行小型 Transformer 模型和 LLM,并可通过 IREE 和 TFLM 编译器支持 TensorFlow、JAX 和 PyTorch。
从谷歌翻译到 ChatGPT,AI 系统通过抓取互联网上的海量文本来学习“说”一门新语言。对于那些使用者较少的语言来说,维基百科有时是其最大的在线语言数据库。因此,这些页面上的任何语法或其他错误,都可能污染 AI 赖以学习的“水源”。这会导致模型在翻译这些语言时尤其容易出错,
苹果又一华人AI高管被Meta挖走了!据彭博社爆料,这次被挖的是Ke Yang(杨克),负责AI搜索与问答系统,几周前刚被任命为AKI团队负责人,负责让Siri追赶上ChatGPT等主流大模型的能力。而离职消息一出,苹果AI的未来或又将添上许多变数。
靠AI挖出了癌症潜在新疗法,AI医疗领域再添猛将。谷歌、耶鲁联手,给攻克冷肿瘤找到了新方法。
Anthropic用Haiku 4.5打响了AI性价比之战!曾经的顶配性能,如今以三分之一的价格、两倍的速度下放,可以说是对高价AI模型的一次降维打击。
如果你曾将收据照片上传至报销系统,或在线阅读过PDF 格式的书籍,那么你可能已经使用过光学字符识别技术 ——这项已有数十年历史的技术能将打印体、手写体或印刷体文本图像转换为计算机可编辑的文本。
谷歌凌晨更新Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入Gemini API与Vertex AI,Flow与Gemini可用。可合成多人物场景、音画同步,片段最长约148秒;规格至1080p/24fps。
还在用Sora2做恶搞视频或表情包玩儿?快醒醒,国内AI视频玩家已实现弯道超车了—— 开卷实时流式生成!
奥特曼宣布重新上线个性化、富有人味的的新ChatGPT版本,并将在12月份开放「成人模式」,OpenAI最终还是没忍住,要抄马斯克的Grok作业了~
人火了是连毕业论文都要被翻出来的(doge)。 这不,宇树科技CEO王兴兴的硕士毕业论文就被网友们掘地三尺找到了。
从「深蓝」到ChatGPT和DeepSeek,AI已从棋盘上的较量转向生产力革命。中国移动以自研「九天」大模型为核心,打造「灵犀智能体」,一个能理解意图、主动服务的全场景生活助手。通过「灵犀贴贴」实现AI+NFC的便捷交互。同时「爱购商城」以「AI豆」构建统一价值体系,打通通信、消费与智能生态,为用户提供个性化、温度化的智能生活新范式。
基础模型(FM)是一种在海量数据上训练的人工智能系统,具备强大的通用性和跨模态能力。港科大最新发表的论文显示:FM可能引领科学进入第五范式,但大模型的偏见、幻觉等问题仍需正视。
开源大模型,进入中国时间。 10月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。 阿里的Qwen系列和DeepSeek,更是从2024年下半年起,就在开源社区构建起越来越深远的影响力。
在AI智能体日益依赖记忆系统的时代,一种新型攻击悄然兴起:记忆投毒。A-MemGuard作为首个专为LLM Agent记忆模块设计的防御框架,通过共识验证和双重记忆结构,巧妙化解上下文依赖与自我强化错误循环的难题,让AI从被动受害者转为主动守护者,成功率高达95%以上。
一张图片包含的信息是多维的。例如下面的图 1,我们至少可以得到三个层面的信息:主体是大象,数量有两头,环境是热带稀树草原(savanna)。然而,如果由传统的表征学习方法来处理这张图片,比方说就将其送入一个在 ImageNet 上训练好的 ResNet 或者 Vision Transformer,往往得到的表征只会体现其主体信息,也就是会简单地将该图片归为大象这一类别。这显然是不合理的。
教育 AI 的热度正重新回到上升曲线。不同于早期的「狂飙阶段」,如今的竞争更像一场结构重排——头部在稳,中腰在提速,尾部在寻找新的出口。AI 在教育中的角色,也从单一的「功能工具」,进化为教学系统中的「生态节点」。
针对视觉 Transformer(ViT)因其固有 “低通滤波” 特性导致深度网络中细节信息丢失的问题,我们提出了一种即插即用、受电路理论启发的 频率动态注意力调制(FDAM)模块。它通过巧妙地 “反转” 注意力以生成高频补偿,并对特征频谱进行动态缩放,最终在几乎不增加计算成本的情况下,大幅提升了模型在分割、检测等密集预测任务上的性能,并取得了 SOTA 效果。