深度|当AI开始构建自己:零犀如何把模型自进化带进真实商业世界

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
深度|当AI开始构建自己:零犀如何把模型自进化带进真实商业世界
7247点击    2026-06-15 14:21

深度|当AI开始构建自己:零犀如何把模型自进化带进真实商业世界


导语


过去很长一段时间里,AI 行业衡量模型进步的方式都相当直观:参数更大、榜单更高、推理更强、上下文更长。每一次模型发布,行业都会盯着数学、代码、知识问答和多模态基准测试,看它是否又向通用智能迈近了一步。


但最近,一个更底层的变化正在发生。


Anthropic 在最新文章《When AI builds itself》中,明确把这个变化摆到了台前:AI 正在参与 AI 自身的开发,而且这种参与已经不再只是写几行代码、补几个函数,而是开始进入工程、研究、实验执行和代码审查等核心环节。按照Anthropic 披露的数据,截至 2026 年 5 月,其代码库中合并的代码超过 80% 由 Claude 编写;如今,工程师平均每季度交付的代码量,是2021 年至 2025 年间的 8 倍。更重要的是,Claude 不再只是人类的代码补全工具,而是可以接手模糊问题、运行代码、定位 Bug、委派子任务,并在越来越长的时间跨度内保持自主工作。


深度|当AI开始构建自己:零犀如何把模型自进化带进真实商业世界


这篇文章之所以重要,并不只是因为Anthropic展示了Claude Code的生产力提升,而是因为它把AI行业正在逼近的一个核心命题说清楚了:如果AI能够越来越多地参与构建AI,那么模型进步的速度可能不再线性依赖人类工程师和研究员,而会进入一种复合加速状态。这就是模型的递归自改进(Recursive Self-Improvement)。


在AI的大部分历史中,模型开发仍然是人类主导的:人类提出方向,人类写代码,人类设计实验,人类分析结果,人类决定下一步。但现在,这条链路正在被AI逐步接管。Anthropic把这个过程分成几个阶段:早期Claude由人类手动开发;随后聊天机器人开始辅助写小段代码;再之后,编程智能体能够自主修改文件;今天,智能体已经可以运行代码、拆解任务、执行数小时工作;而未来的某个时间点,闭环可能真正形成——AI系统足够强大,可以自行构建和训练自己的下一代。


01 可验证环境与真实业务:自进化的“实验室”与“战场”


如果说过去的大模型竞争,比的是谁训练出了更强的模型,那么下一阶段的竞争,很可能变成谁拥有更快的自我改进速度。未来最强的AI系统,未必只是“训练出来”的,而可能是“进化出来”的。


这也是为什么,自进化正在成为全球顶级AI实验室的共同方向。


Google DeepMind发布AlphaEvolve,展示了AI自主发现和优化算法的能力。它不是简单回答问题,而是生成候选解、验证效果、选择更优版本,再进入下一轮迭代。OpenAI也在Self-Evolving Agents相关方法中强调,Agent不应是一次性配置好的静态系统,而应该通过反馈、评估和元提示持续修正自身行为。MIT提出SEAL框架,探索语言模型如何通过自生成数据和强化学习更新自身能力。Anthropic最新文章则进一步把这个趋势推向AI研发本身:当AI开始写代码、跑实验、做研究判断,AI系统的进步会越来越多地由AI自身推动。


但这里有一个容易被忽视的问题。


今天全球顶级实验室讨论的自进化,大多发生在代码、数学、科学发现和AI研发这些领域。它们有一个共同特点:结果相对容易验证。


代码可以运行,测试能不能通过一目了然。数学题有标准答案。算法性能可以量化。研究实验虽然复杂,但至少可以定义目标函数、比较实验结果、复现已有结论。换句话说,这些场景天然具备Verifiable Environment,可验证环境。


可验证环境是AI自进化的燃料。因为模型只有知道自己哪里做对、哪里做错,才可能持续优化。如果没有反馈,所谓自进化就只能停留在生成更多内容,而不是真正变强。


这也是为什么代码Agent率先爆发。Claude写完代码,可以运行测试;Codex修完Bug,可以看CI结果;AlphaEvolve提出算法,可以测运行效率。反馈信号清晰、密集、可自动化,强化学习和进化搜索就能发挥巨大作用。


但真实商业世界并不是这样。


比如在客户经营、销售转化、保险服务、汽车营销等场景中,结果往往具有长链路、弱监督和复杂归因的特点。它们没有编译器,没有单元测试,也没有标准答案。用户最终是否完成转化,受到需求、预算、时机、信任、决策链条、产品理解以及外部环境等多重因素共同影响。一次结果的产生,往往来自多个环节长期累积的作用,而不是某一个动作的直接反馈。


这意味着,如果要让AI在真实业务场景中实现自进化,复杂度远高于在代码环境中实现自进化。因为系统面对的第一个问题不是生成,而是归因。


一个用户成交了,到底是因为AI策略有效,还是客户原本就有较强意向?一个用户流失了,到底是因为策略选择失误,还是需求本身并不成立?一次结果的产生背后究竟有哪些关键变量发挥了作用?这些问题都无法通过单个样本直接判断,必须在大规模真实业务数据中进行统计分析、因果推断和反事实评估。


更重要的是,业务结果天然属于稀疏奖励。代码任务中,几分钟就能获得一次测试反馈;而真实业务场景中,可能经历大量交互和决策之后,才会产生最终结果。最终结果出现在链路末端,而中间每一步动作都可能影响结果。强化学习里有一个经典问题叫Credit Assignment,也就是最终奖励到底应该归功于哪个动作。在真实业务场景里,这个问题被进一步放大。


这也是为什么过去很多Agent看起来能够完成任务,却很难真正“对结果负责”。它们可以生成内容、调用工具、执行流程,但一旦要回答“什么动作真正提升了结果”,系统往往缺乏足够清晰的解释能力。因为它没有把真实业务结果转化为可学习、可优化的训练信号。


零犀科技要解决的,正是这个问题。


如果说Anthropic讨论的是“AI如何参与构建AI”,那么零犀正在探索的是另一个同样关键的问题:AI如何在真实商业场景中,从自己的业务结果里持续学习,并把这种学习进化为下一轮能力。


换句话说,Anthropic展示的是通用AI研发链路里的自我构建;零犀要做的是垂直业务场景里的自我进化。


这两者之间有一个微妙但重要的差别。通用AI自进化优化的是模型能力本身,例如代码、研究、推理、实验执行。零犀自进化优化的是业务决策能力,例如用户理解、需求判断、异议处理、策略选择、跟进节奏、成交推进、合规控制。前者的目标是让AI更会构建AI,后者的目标是让AI更会完成真实业务结果,把数字世界的模型能力,进一步延展到物理世界。


02 业务自进化的核心命题:从统计相关到因果规律


零犀自进化架构的出发点:不是单纯提升模型回答质量,而是让AI Sales Agent能够对线索转化率、客户推进效率、成交概率、合规性、客户满意度以及销售动作的可复用性负责。


在零犀的系统中,一次销售任务不会被简化成“用户问了什么,模型答了什么”。系统会记录完整的Trajectory,也就是一次真实销售行动轨迹。这个轨迹包括用户输入、Agent判断、话术生成、工具调用、客户反馈、推进动作和最终结果。它不是一个静态对话样本,而是一条完整的业务因果链路。


因此,零犀所强调的自进化,并不是围绕“更像人说话”展开,而是围绕“更有效地做决策”展开。


这种能力的形成,并不依赖某一次模型升级,而来自长期业务反馈的持续沉淀。每一次成功、失败、转化、流失,都会成为系统理解业务规律的一部分。随着业务规模扩大,系统能够看到越来越丰富的用户状态、策略组合和结果反馈,从而不断优化自身对于业务世界的理解。


归因在其中扮演着重要角色。


过去,销售经验往往存在于销冠脑子里。一个Top销售知道什么时候该推进,什么时候该停顿,什么时候该转移话题,什么时候该补充证据,但这种能力通常很难被清晰表达,更难复制给整个组织。零犀希望做的,是把这些经验逐步转化为可沉淀、可复用、可持续优化的机器能力。


这一步非常关键。因为只有模型知道“什么因素真正改变了结果”,才谈得上持续成长。否则,它只能停留在表面相关性之中。


例如,系统可能发现“长时间沟通”与成交存在相关性。但这并不意味着Agent应该刻意延长对话。如果长时间沟通背后其实是用户持续质疑,甚至产生反感,那么这种策略不仅不会提升转化,反而可能提高投诉率。真正需要理解的是更深层的业务规律:在什么用户状态下,什么沟通动作能够建立信任;在什么节点继续推进有效,什么节点应该暂停;什么策略会提高理解,什么策略会造成压力。


因此,零犀更关注的是从结果中提炼规律,而不是从表象中寻找答案。


这种能力最终会沉淀为系统持续优化的基础。它可能表现为更合理的策略选择、更精准的客户理解、更有效的资源配置,也可能表现为新的业务能力被不断发现和吸收。对于外界而言,看到的是Agent越来越懂业务;对于系统而言,本质上是在不断积累关于业务世界的认知。


当然,任何进化都需要边界。


如果只追求短期转化率,系统很容易走向局部最优。一个策略可能提升短期成交,却损害长期信任;一个动作可能提高回复率,却带来合规风险。因此,真正有价值的进化从来不是单一指标驱动,而是在效果、风险、成本、客户体验和长期价值之间寻找平衡。


这也是零犀一直强调的方向:让AI不仅能够创造结果,更能够在可持续、可验证、可管理的框架下创造结果。


03 壁垒不止在模型参数,更在业务进化飞轮


零犀所构建的并不仅仅是一套销售Agent系统,而是在商业世界中逐步建立一种新的学习机制。


代码世界的学习来自测试集和编译器。商业世界没有这样的天然环境,因此必须依靠真实业务闭环来形成反馈。用户状态、策略干预、交互过程、最终结果、合规反馈、成本数据以及专家经验,共同构成了这个环境。随着系统不断运行,这些反馈会持续沉淀,并推动能力不断演化。


深度|当AI开始构建自己:零犀如何把模型自进化带进真实商业世界


这也是零犀壁垒的核心。


第一层是结果数据壁垒。零犀沉淀的不是普通对话语料,而是带有业务目标和结果标签的全链路数据。这类数据能够直接用于状态识别、策略评估和业务优化,回答哪些信号、策略和表达真正带来转化。相比通用互联网语料,它更稀缺,也更贴近真实业务交付。


第二层是业务Know-how的AI化壁垒。零犀持续把行业Top专家在用户需求判断、成交节奏把握、策略切换和复杂决策上的经验,转化为可复制、可验证、可持续优化的机器能力。过去属于个人经验的能力,正在逐步成为组织能力和系统能力。


第三层是迭代速度壁垒。模型不是上线后静态运行,而是在真实业务中持续评估、持续优化、持续成长。每一次用户交互、策略干预和最终结果,都可能成为下一轮能力提升的起点。


这也是为什么,基座模型越强,零犀的价值不但不会被削弱,反而可能被放大。


因为零犀并不把壁垒建立在某个基座模型参数上,而是建立在“把模型能力稳定转化为业务结果”的系统能力上。通用模型提供更强的理解、推理、语音和多模态能力,零犀则把这些能力接入行业数据、因果框架、奖励模型、评估体系和策略编排之中。底座越强,零犀后训练和业务闭环的杠杆越大。


这与Anthropic文章中的一个判断高度呼应:当AI执行能力越来越强,真正稀缺的将不再是单个任务的完成能力,而是如何设定目标、验证结果、控制风险、消除瓶颈。Anthropic看到的是AI研发组织中的瓶颈迁移:当Claude能写越来越多代码,人工代码审查变成瓶颈;当Claude能跑越来越多实验,问题变成哪些实验值得做。零犀面对的也是类似问题:当Sales Agent能完成越来越多触达、沟通和跟进,真正关键的就变成哪些用户值得触达、哪些策略值得采用、哪些能力值得沉淀、哪些短期收益必须被抑制。


所以,零犀的自进化不是无约束进化,而是带验证、带合规、带成本、带长期目标的进化。


它不是让AI为了成交不择手段,而是让AI在合规、安全、客户体验和长期信任约束下,持续寻找更优销售决策。这一点决定了它与普通“自动化销售工具”的本质差别。后者解决的是流程替代,前者解决的是能力增长。


04 AI竞争力的下一站


真实的业务不是静态任务。用户会变,渠道会变,监管会变,产品会变,竞争环境会变。如果一个AI系统只能在上线时表现不错,而不能持续适应变化,它就很难长期对结果负责。真正能够背KPI的AI,必须能够从每一次交付中学习,把成功沉淀下来,把失败转化为下一轮改进。


零犀自进化架构让AI Sales Agent不再是一次性配置出来的工具,而是一个能够从销售实践中持续学习、把专家经验因果化沉淀,并最终对销售效果负责的进化系统。


Anthropic的《When AI builds itself》让行业看到,AI正在进入一个新阶段:AI不只是被人类使用,而是开始参与构建自己。零犀则把这个趋势带进真实商业世界:AI不只是执行销售流程,而是开始从销售结果中构建自己的下一代能力。


前者指向通用智能的递归自我改进。后者指向垂直行业的业务自进化。


对于投资人而言,这里面真正重要的不是某一个Agent产品,也不是某一套话术系统,而是一个更长期的判断:未来最有价值的AI公司,未必只是拥有最强模型的公司,而是那些能够把真实世界反馈变成持续进化飞轮的公司。


因为模型能力会越来越强,工具会越来越便宜,单点功能会越来越容易被复制。但真实业务结果数据、行业Know-how、因果归因体系、验证机制和长期迭代闭环,会在每一次交付中不断加深。


当AI开始自己构建自己,通用模型实验室会进入加速周期。当AI开始从业务结果中进化,垂直行业也会进入新的竞争周期。


零犀押注的正是后者:在销售这样最难验证、最难归因、也最接近商业结果的场景中,让AI不仅会说、会做,而且会学习、会复盘、会进化,并最终成为一个真正能够持续背KPI的数字劳动力。


这或许就是自进化在商业世界中最现实、也最有价值的落点。


文章来自于"Z Potentials",作者 "Z Potentials"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md