深度｜当AI开始构建自己：零犀如何把模型自进化带进真实商业世界

7247点击 2026-06-15 14:21

导语

过去很长一段时间里，AI 行业衡量模型进步的方式都相当直观：参数更大、榜单更高、推理更强、上下文更长。每一次模型发布，行业都会盯着数学、代码、知识问答和多模态基准测试，看它是否又向通用智能迈近了一步。

但最近，一个更底层的变化正在发生。

Anthropic 在最新文章《When AI builds itself》中，明确把这个变化摆到了台前：AI 正在参与 AI 自身的开发，而且这种参与已经不再只是写几行代码、补几个函数，而是开始进入工程、研究、实验执行和代码审查等核心环节。按照Anthropic 披露的数据，截至 2026 年 5 月，其代码库中合并的代码超过 80% 由 Claude 编写；如今，工程师平均每季度交付的代码量，是2021 年至 2025 年间的 8 倍。更重要的是，Claude 不再只是人类的代码补全工具，而是可以接手模糊问题、运行代码、定位 Bug、委派子任务，并在越来越长的时间跨度内保持自主工作。

深度｜当AI开始构建自己：零犀如何把模型自进化带进真实商业世界

这篇文章之所以重要，并不只是因为Anthropic展示了Claude Code的生产力提升，而是因为它把AI行业正在逼近的一个核心命题说清楚了：如果AI能够越来越多地参与构建AI，那么模型进步的速度可能不再线性依赖人类工程师和研究员，而会进入一种复合加速状态。这就是模型的递归自改进（Recursive Self-Improvement）。

在AI的大部分历史中，模型开发仍然是人类主导的：人类提出方向，人类写代码，人类设计实验，人类分析结果，人类决定下一步。但现在，这条链路正在被AI逐步接管。Anthropic把这个过程分成几个阶段：早期Claude由人类手动开发；随后聊天机器人开始辅助写小段代码；再之后，编程智能体能够自主修改文件；今天，智能体已经可以运行代码、拆解任务、执行数小时工作；而未来的某个时间点，闭环可能真正形成——AI系统足够强大，可以自行构建和训练自己的下一代。

01 可验证环境与真实业务：自进化的“实验室”与“战场”

如果说过去的大模型竞争，比的是谁训练出了更强的模型，那么下一阶段的竞争，很可能变成谁拥有更快的自我改进速度。未来最强的AI系统，未必只是“训练出来”的，而可能是“进化出来”的。

这也是为什么，自进化正在成为全球顶级AI实验室的共同方向。

Google DeepMind发布AlphaEvolve，展示了AI自主发现和优化算法的能力。它不是简单回答问题，而是生成候选解、验证效果、选择更优版本，再进入下一轮迭代。OpenAI也在Self-Evolving Agents相关方法中强调，Agent不应是一次性配置好的静态系统，而应该通过反馈、评估和元提示持续修正自身行为。MIT提出SEAL框架，探索语言模型如何通过自生成数据和强化学习更新自身能力。Anthropic最新文章则进一步把这个趋势推向AI研发本身：当AI开始写代码、跑实验、做研究判断，AI系统的进步会越来越多地由AI自身推动。

但这里有一个容易被忽视的问题。

今天全球顶级实验室讨论的自进化，大多发生在代码、数学、科学发现和AI研发这些领域。它们有一个共同特点：结果相对容易验证。

代码可以运行，测试能不能通过一目了然。数学题有标准答案。算法性能可以量化。研究实验虽然复杂，但至少可以定义目标函数、比较实验结果、复现已有结论。换句话说，这些场景天然具备Verifiable Environment，可验证环境。

可验证环境是AI自进化的燃料。因为模型只有知道自己哪里做对、哪里做错，才可能持续优化。如果没有反馈，所谓自进化就只能停留在生成更多内容，而不是真正变强。

这也是为什么代码Agent率先爆发。Claude写完代码，可以运行测试；Codex修完Bug，可以看CI结果；AlphaEvolve提出算法，可以测运行效率。反馈信号清晰、密集、可自动化，强化学习和进化搜索就能发挥巨大作用。

但真实商业世界并不是这样。

比如在客户经营、销售转化、保险服务、汽车营销等场景中，结果往往具有长链路、弱监督和复杂归因的特点。它们没有编译器，没有单元测试，也没有标准答案。用户最终是否完成转化，受到需求、预算、时机、信任、决策链条、产品理解以及外部环境等多重因素共同影响。一次结果的产生，往往来自多个环节长期累积的作用，而不是某一个动作的直接反馈。

这意味着，如果要让AI在真实业务场景中实现自进化，复杂度远高于在代码环境中实现自进化。因为系统面对的第一个问题不是生成，而是归因。

一个用户成交了，到底是因为AI策略有效，还是客户原本就有较强意向？一个用户流失了，到底是因为策略选择失误，还是需求本身并不成立？一次结果的产生背后究竟有哪些关键变量发挥了作用？这些问题都无法通过单个样本直接判断，必须在大规模真实业务数据中进行统计分析、因果推断和反事实评估。

更重要的是，业务结果天然属于稀疏奖励。代码任务中，几分钟就能获得一次测试反馈；而真实业务场景中，可能经历大量交互和决策之后，才会产生最终结果。最终结果出现在链路末端，而中间每一步动作都可能影响结果。强化学习里有一个经典问题叫Credit Assignment，也就是最终奖励到底应该归功于哪个动作。在真实业务场景里，这个问题被进一步放大。

这也是为什么过去很多Agent看起来能够完成任务，却很难真正“对结果负责”。它们可以生成内容、调用工具、执行流程，但一旦要回答“什么动作真正提升了结果”，系统往往缺乏足够清晰的解释能力。因为它没有把真实业务结果转化为可学习、可优化的训练信号。

零犀科技要解决的，正是这个问题。

如果说Anthropic讨论的是“AI如何参与构建AI”，那么零犀正在探索的是另一个同样关键的问题：AI如何在真实商业场景中，从自己的业务结果里持续学习，并把这种学习进化为下一轮能力。

换句话说，Anthropic展示的是通用AI研发链路里的自我构建；零犀要做的是垂直业务场景里的自我进化。

这两者之间有一个微妙但重要的差别。通用AI自进化优化的是模型能力本身，例如代码、研究、推理、实验执行。零犀自进化优化的是业务决策能力，例如用户理解、需求判断、异议处理、策略选择、跟进节奏、成交推进、合规控制。前者的目标是让AI更会构建AI，后者的目标是让AI更会完成真实业务结果，把数字世界的模型能力，进一步延展到物理世界。

02 业务自进化的核心命题：从统计相关到因果规律

零犀自进化架构的出发点：不是单纯提升模型回答质量，而是让AI Sales Agent能够对线索转化率、客户推进效率、成交概率、合规性、客户满意度以及销售动作的可复用性负责。

在零犀的系统中，一次销售任务不会被简化成“用户问了什么，模型答了什么”。系统会记录完整的Trajectory，也就是一次真实销售行动轨迹。这个轨迹包括用户输入、Agent判断、话术生成、工具调用、客户反馈、推进动作和最终结果。它不是一个静态对话样本，而是一条完整的业务因果链路。

因此，零犀所强调的自进化，并不是围绕“更像人说话”展开，而是围绕“更有效地做决策”展开。

这种能力的形成，并不依赖某一次模型升级，而来自长期业务反馈的持续沉淀。每一次成功、失败、转化、流失，都会成为系统理解业务规律的一部分。随着业务规模扩大，系统能够看到越来越丰富的用户状态、策略组合和结果反馈，从而不断优化自身对于业务世界的理解。

归因在其中扮演着重要角色。

过去，销售经验往往存在于销冠脑子里。一个Top销售知道什么时候该推进，什么时候该停顿，什么时候该转移话题，什么时候该补充证据，但这种能力通常很难被清晰表达，更难复制给整个组织。零犀希望做的，是把这些经验逐步转化为可沉淀、可复用、可持续优化的机器能力。

这一步非常关键。因为只有模型知道“什么因素真正改变了结果”，才谈得上持续成长。否则，它只能停留在表面相关性之中。

例如，系统可能发现“长时间沟通”与成交存在相关性。但这并不意味着Agent应该刻意延长对话。如果长时间沟通背后其实是用户持续质疑，甚至产生反感，那么这种策略不仅不会提升转化，反而可能提高投诉率。真正需要理解的是更深层的业务规律：在什么用户状态下，什么沟通动作能够建立信任；在什么节点继续推进有效，什么节点应该暂停；什么策略会提高理解，什么策略会造成压力。

因此，零犀更关注的是从结果中提炼规律，而不是从表象中寻找答案。

这种能力最终会沉淀为系统持续优化的基础。它可能表现为更合理的策略选择、更精准的客户理解、更有效的资源配置，也可能表现为新的业务能力被不断发现和吸收。对于外界而言，看到的是Agent越来越懂业务；对于系统而言，本质上是在不断积累关于业务世界的认知。

当然，任何进化都需要边界。

如果只追求短期转化率，系统很容易走向局部最优。一个策略可能提升短期成交，却损害长期信任；一个动作可能提高回复率，却带来合规风险。因此，真正有价值的进化从来不是单一指标驱动，而是在效果、风险、成本、客户体验和长期价值之间寻找平衡。

这也是零犀一直强调的方向：让AI不仅能够创造结果，更能够在可持续、可验证、可管理的框架下创造结果。

03 壁垒不止在模型参数，更在业务进化飞轮

零犀所构建的并不仅仅是一套销售Agent系统，而是在商业世界中逐步建立一种新的学习机制。

代码世界的学习来自测试集和编译器。商业世界没有这样的天然环境，因此必须依靠真实业务闭环来形成反馈。用户状态、策略干预、交互过程、最终结果、合规反馈、成本数据以及专家经验，共同构成了这个环境。随着系统不断运行，这些反馈会持续沉淀，并推动能力不断演化。

深度｜当AI开始构建自己：零犀如何把模型自进化带进真实商业世界

这也是零犀壁垒的核心。

第一层是结果数据壁垒。零犀沉淀的不是普通对话语料，而是带有业务目标和结果标签的全链路数据。这类数据能够直接用于状态识别、策略评估和业务优化，回答哪些信号、策略和表达真正带来转化。相比通用互联网语料，它更稀缺，也更贴近真实业务交付。

第二层是业务Know-how的AI化壁垒。零犀持续把行业Top专家在用户需求判断、成交节奏把握、策略切换和复杂决策上的经验，转化为可复制、可验证、可持续优化的机器能力。过去属于个人经验的能力，正在逐步成为组织能力和系统能力。

第三层是迭代速度壁垒。模型不是上线后静态运行，而是在真实业务中持续评估、持续优化、持续成长。每一次用户交互、策略干预和最终结果，都可能成为下一轮能力提升的起点。

这也是为什么，基座模型越强，零犀的价值不但不会被削弱，反而可能被放大。

因为零犀并不把壁垒建立在某个基座模型参数上，而是建立在“把模型能力稳定转化为业务结果”的系统能力上。通用模型提供更强的理解、推理、语音和多模态能力，零犀则把这些能力接入行业数据、因果框架、奖励模型、评估体系和策略编排之中。底座越强，零犀后训练和业务闭环的杠杆越大。

这与Anthropic文章中的一个判断高度呼应：当AI执行能力越来越强，真正稀缺的将不再是单个任务的完成能力，而是如何设定目标、验证结果、控制风险、消除瓶颈。Anthropic看到的是AI研发组织中的瓶颈迁移：当Claude能写越来越多代码，人工代码审查变成瓶颈；当Claude能跑越来越多实验，问题变成哪些实验值得做。零犀面对的也是类似问题：当Sales Agent能完成越来越多触达、沟通和跟进，真正关键的就变成哪些用户值得触达、哪些策略值得采用、哪些能力值得沉淀、哪些短期收益必须被抑制。

所以，零犀的自进化不是无约束进化，而是带验证、带合规、带成本、带长期目标的进化。

它不是让AI为了成交不择手段，而是让AI在合规、安全、客户体验和长期信任约束下，持续寻找更优销售决策。这一点决定了它与普通“自动化销售工具”的本质差别。后者解决的是流程替代，前者解决的是能力增长。

04 AI竞争力的下一站

真实的业务不是静态任务。用户会变，渠道会变，监管会变，产品会变，竞争环境会变。如果一个AI系统只能在上线时表现不错，而不能持续适应变化，它就很难长期对结果负责。真正能够背KPI的AI，必须能够从每一次交付中学习，把成功沉淀下来，把失败转化为下一轮改进。

零犀自进化架构让AI Sales Agent不再是一次性配置出来的工具，而是一个能够从销售实践中持续学习、把专家经验因果化沉淀，并最终对销售效果负责的进化系统。

Anthropic的《When AI builds itself》让行业看到，AI正在进入一个新阶段：AI不只是被人类使用，而是开始参与构建自己。零犀则把这个趋势带进真实商业世界：AI不只是执行销售流程，而是开始从销售结果中构建自己的下一代能力。

前者指向通用智能的递归自我改进。后者指向垂直行业的业务自进化。

对于投资人而言，这里面真正重要的不是某一个Agent产品，也不是某一套话术系统，而是一个更长期的判断：未来最有价值的AI公司，未必只是拥有最强模型的公司，而是那些能够把真实世界反馈变成持续进化飞轮的公司。

因为模型能力会越来越强，工具会越来越便宜，单点功能会越来越容易被复制。但真实业务结果数据、行业Know-how、因果归因体系、验证机制和长期迭代闭环，会在每一次交付中不断加深。

当AI开始自己构建自己，通用模型实验室会进入加速周期。当AI开始从业务结果中进化，垂直行业也会进入新的竞争周期。

零犀押注的正是后者：在销售这样最难验证、最难归因、也最接近商业结果的场景中，让AI不仅会说、会做，而且会学习、会复盘、会进化，并最终成为一个真正能够持续背KPI的数字劳动力。

这或许就是自进化在商业世界中最现实、也最有价值的落点。

文章来自于"Z Potentials"，作者 "Z Potentials"。

关键词: AI新闻 , AI销售 , 零犀科技 , 销售智能体

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md