AI 购物,从万能的淘宝相机开始
AI 购物,从万能的淘宝相机开始《DT商业观察》留意到,即便是电商常见的“图搜找同款”场景,自从淘宝图像搜索产品@拍立淘新上线了“AI模式”,把“图搜”功能进化成“启发式图搜”,用户的玩法也已升级。
搜索
《DT商业观察》留意到,即便是电商常见的“图搜找同款”场景,自从淘宝图像搜索产品@拍立淘新上线了“AI模式”,把“图搜”功能进化成“启发式图搜”,用户的玩法也已升级。
谷歌母公司Alphabet营收达到1099亿美元,每股收益5.11美元,远超华尔街预期的2.62美元;亚马逊净销售额1815亿美元,净利润303亿美元,每股收益2.78美元,几乎是预期的两倍;微软营收829亿美元,同比增长18%;Meta净利润268亿美元,同比接近翻倍。
今天,OpenAI 官方播客发布了一期节目,让内部研究员 Sebastian Bubeck 和 Ernest Ryu 出来回答这一问题,毕竟大家都十分好奇。Ernest 近期刚加入 OpenAI 担任研究员,他之前是加州大学洛杉矶分校(UCLA)数学系的教授,研究优化和机器学习理论。他是最早尝试用 ChatGPT 解数学开放问题的那批人之一。
我发现:Claude 一边把中国大陆挡在门外,一边在认认真真做简体中文。事情是这样—— 前两天我把 Claude 文档 URL 里的 /en/ 改成了 /zh-CN/。页面唰地就变了。整站简体中文,翻译贼讲究。
这段时间做了巨多PPT。 多到我现在都条件反射了,好不好看先放一边,先看AI容易错的细节。 文字有没有糊,布局是不是在装高级,图片是不是只是看起来有氛围感,该有的信息都没放进去, 再就是画面上有没有一
嗨大家好!我是阿真! 朋友们,好像标题党了,先别骂,看完指定有灵感。整了点不错的东西,这次真的可以把 PPT 做得很好看了!快放假之前给大家再分享一波,这个真的很棒的不容错过。 首先我其实是很早就想做
基于视觉语言模型(VLM)的多智能体系统(MAS)正成为复杂多模态协作的核心方案,却被一个致命痛点死死卡住:多智能体视觉幻觉滚雪球——单个智能体的视觉误判通过纯文本信息流逐级放大,早期细微错误最终演变成系统性崩溃。
MONTEE AI 近日宣布完成首轮融资,成立于2025年,MONTEE AI是全球首款玩偶交互式AI故事机。公司身后是一支来自硅谷、字节跳动、Google 和常青藤的团队,联动幼教出版世家五十年资源沉淀,正在重新定义儿童故事机品类。
Pictoria是一家专注于AI虚拟主播(vTuber)运营的日本公司。近期,该公司完成了2.2亿日元的A轮融资,投资方包括B Dash Ventures和Adways Ventures,至此其累计融资金额已达4.8亿日元。
AI医疗最成熟的领域,迎来了一款重磅产品——颅脑CT超级智能体“小君医生2.0”。这是全球首个临床可用+检查项目级的颅脑CT智能体,能够覆盖90%的颅脑病变,诊断准确率达87.8%,90%以上病例无需修改或仅小幅度修改即可使用,将报告时效从15分钟大幅压缩至1分钟,已落地中国顶流三甲北京天坛医院,极大提升了医院影像诊断的效率。
刚刚,DeepSeek 在 Github 上正式发布了多模态模型,公布了背后的技术报告。实打实的新鲜出炉!而且是开创性的推理范式。下面我们就基于 DeepSeek 这篇技术报告,具体看看 DeepSeek、北京大学、清华大学又创造了怎样的奇迹。
今天凌晨,谷歌 Gemini 突然放大招,它在 X 上宣布:现在 Gemini 可以直接生成PDF、Word、Excel 或 Google Workspace 等文件,无需上传模板,只用和Gemini交流要做什么和讲清文件格式。
最近朋友推荐了 CodeBanana,说它跟之前用过的那些 AI 写代码的工具的体验感完全不同。我最近挑了几个真实工作场景跑了一遍,读项目、拆需求、写需求、生成测试用例、定时任务等等都和日常工作很贴近的任务进行了尝试。今天挑五个我自己觉得最值得讲的,跟你聊聊我的体验。
就在昨天,Zed 正式发布了 1.0 版本。这个历时五年开发、经历超过 1000 个预发布版本、累计百万行 Rust 代码,Atom 编辑器原班人马打造的“下一代代码编辑器”,终于走到了——官方称“大多数开发者可以安心切换的时刻”。
刚刚,Anthropic 公布了 Claude Code 比赛的六组获奖作品。这是 Claude 和 Cerebral Valley 联合办的一场黑客松,规则是:用 Opus 4.7 + Claude Code,一周时间,做个东西出来。
刚刚,宇树发布其迄今定价最低的人形机器人——R1系列双臂人形机器人,支持工业及日常家用多元场景应用,售价2.69万元起。这是宇树首款主打桌面、面向工业场景的低成本轻量化上半身双臂方案。该系列机器人支持5/7自由度单臂、固定/移动底盘,头部模组算力达10TOPS,末端可快速换装,手臂最大负载2kg,腰部±150°、头部±115°/±36°大运动范围。
4 月 30 日,阿里发布全新 Agent 产品 QoderWake,定位是“生产可用、安全可控、自进化的数字员工”。它不是再做一个“更聪明的 AI 助手”,而是试图回答一个更难的问题:Agent 如何从工具变成岗位。
OpenAI正儿八经写了一篇研究复盘,标题看起来却像个段子: GPT-5.5爱说哥布林,正是这两天OpenAI用户最热议话题。起初,是有人发现Codex系统提示词中特别强调了两遍:禁止谈论哥布林、妖精、巨魔等生物。
陶哲轩最新判断,数学正在从「证明稀缺」进入「证明过剩」时代——数学家最值钱的工作已不再只是「做出证明」,而是验证它、消化它,并把一块 AI 吐出的「生肉证明」变成人类真正吃得下的知识。
在前不久的 AI TECH DAY 上,斑马智能又新发布了“元神 AI 汽车机器人大脑”,同时推出 AutoOmni 全模态端模型产品矩阵与“龙虾上车”方案 AutoClaw,构成所谓的“一脑双引擎”升级。这不只是一轮产品迭代,更像在做一次预判:汽车正在从功能的集合机器,变成一个可以持续进化、还能主动协作的的智能体系统。
今天,智谱发布了一篇名为《Scaling Pain:超大规模Coding Agent推理实践》的技术报告,披露了GLM-5系列模型在Coding Agent场景下遇到的推理基础设施挑战与对应解法。
Manus收购案在AI的商业化发展中具有标志性意义。这其中,一个被科技圈忽视,但已经在法律界引起讨论的关键问题是:为什么这次对Manus的监管启动的是外商投资安全审查?
智元机器人的办公室里,最近员工们一上班就能看到机器人熟练地切着水果:这么全面的能力是如何做到的?答案是直接在真实环境中搞大规模分布式强化学习训练。它们使用的是全新的具身智能训练范式:面向通用机器人策略的分布式多机强化学习(LWD)。这一套技术捅破了当前VLA的「天花板」。
今天凌晨,谷歌母公司Alphabet公布2026财年第一季度财报。本财季,营收和净利润超出市场预期,营收达1098.96亿美元(约合人民币7506亿元),同比增长22%,按固定汇率计算同比增长19%,实现连续11个季度的两位数增长;归母净利润625.78亿美元(约合人民币4274亿元),同比暴增81%;摊薄EPS 5.11美元,同比增长82%。
OpenAI刚用Deep Research抢了先手,谷歌直接掀桌!DeepMind祭出研究智能体双杀,Max版质量评分从66.1%暴拉到93.3%,知识工作自动化的军备竞赛正式进入贴身肉搏。
最近,越来越多的AI助手盯上了“帮你花钱”这件事。ChatGPT早已上线购物功能,Gemini也在今年补齐AI购物体验。国内的淘宝、京东等电商平台,也都尝试将AI融入购物决策链路。原因也不难猜测:谁能帮用户更快、更准地做出消费决策,谁就有望握住离交易最近的那个入口。
深圳机器人凭什么惊艳全球?答案不在整机,在一颗电机。小象电动用轴向磁通路线突破量产瓶颈,累计出货近7万台,杀入华为、比亚迪、广汽、美团供应链,完成超亿元融资。这是深圳底层硬科技崛起的缩影,也是中国机器人产业链从「能做样机」到「真正量产」的关键一跃。
Snapchat 近日宣布,在其核心聊天功能中推出全新广告产品 AI Sponsored Snaps。这一产品是在原有 Sponsored Snaps 广告形式基础上的全新升级,广告主可以将自有 AI Agent 接入 Snapchat 聊天界面,与用户展开实时、个性化的深度交流互动。
据央视新闻报道,今天,《全国数据资源调查报告(2025 年)》在第九届数字中国建设峰会上发布。报告显示,2025 年,全国数据生产总量同比增长 27.28%,达到 52.26ZB(ZettaByte,泽字节 | 1ZB=1024EB),这相当于全国所有算力中心存储容量的近 30 倍。从国际来看,我国数据生产总量占全球的 27.44%。
OpenAI 的「星际之门」计划,今天有了新进度:承诺29年建成的10GW算力,现已超额完成,最近 90 天单独又加了 3GW。