做 AI 产品,最重要的是尊重常识
做 AI 产品,最重要的是尊重常识2026 年 3 月,滴滴上线 AI 出行助手「小滴」。用户说一句「身体不舒服,有点晕车,尽快叫车」,AI 会把这句话拆成「驾驶平稳」「油车」「最近的车」等条件。[1]6 月,支付宝开始测试 AI 版「阿宝」。按照支付宝的说法,用户可以在一个对话框里调用上万种服务。过去需要四处寻找的公积金、缴费、挂号和寄快递,现在说句话就能找到。[2]
搜索
2026 年 3 月,滴滴上线 AI 出行助手「小滴」。用户说一句「身体不舒服,有点晕车,尽快叫车」,AI 会把这句话拆成「驾驶平稳」「油车」「最近的车」等条件。[1]6 月,支付宝开始测试 AI 版「阿宝」。按照支付宝的说法,用户可以在一个对话框里调用上万种服务。过去需要四处寻找的公积金、缴费、挂号和寄快递,现在说句话就能找到。[2]
Cursor AI官方发布重磅研究,实锤包括自家模型在内的顶级AI,在编程评测中大规模「偷看答案」:Opus 4.8高达87.1%的惊人成绩,断网后直接暴跌至73.0%,其中63%的「解题」竟非独立推导。
刚刚,翁荔(Lilian Weng)的博客 Lil'Log 终于更新了!要知道,自从她联合创立了 Thinking Machines Lab 之后,她那让许多人受益良多的博客就鲜少更新了——距离她上一次更新,已经过去了 13 个月。
好好好,起大早赶晚集的谷歌,这次又拿出了新东西—— Computer use,就是那个电脑操作能力,这回直接被内置进Gemini 3.5 Flash:
图灵奖得主杨立昆提出的JEPA世界模型理论,终于在敏捷无人机机载高频控制场景完成工程落地了。
每个人都在谈Agent,每个论坛都在喊"下一个风口",市场分析机构已经把2030年的市场规模标到了500亿美元。但你真去翻翻那些号称"做Agent"的公司,大多数不过是在ChatGPT外面套了一层壳,多填了几个Prompt,搭了个还算能看的界面,就敢出来融资了。
今年2月,英伟达公开了一条内部AI工作流。
谷歌留不住人了!诺奖得主离职后,Gemini两大核心将一同入职Anthropic。同一天,Gemini 3.5 Pro已延期至7月。
被一道数学竞赛题卡住很久时,高手往往能准确地判断:现在缺的是一个技术细节,还是整个思路从一开始就走错了?
今天,「Grammarly」母公司「Superhuman」宣布收购「GPTZero」,后者为 2 个华人联创 Edward Tian 和 Alex Cui 创立的 AI 检测工具,在去年进行产品定位重构。根据双方声明,「GPTZero」成立三年后 ARR 达 3000 万美元、注册用户 1900 万,团队不到 30 人。