Agent 时代,如何办公

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Agent 时代,如何办公
8605点击    2026-05-19 10:03

最开始以为,只是一次,不会怎么样..


我已经回不去了


第一次用 Agent 处理合同的时候,我跟自己说,就这一次,试试。然后是邮件,然后是材料,然后是活动复盘。现在一个小时过几十份文档,手都不抖。以前一天的工作量,现在是热身,总量翻了十倍还都觉得不够。你知道最可怕的是什么吗?我已经不记得以前是怎么干活的了...


Agent 时代,如何办公


我自己主力 Agent 是 Claude Code,最高级的会员,整天挂着不间断地干活;承接这些活的容器是飞书,所有文档、合同、邮箱、活动资料、酒吧物料都堆在那儿。中间用 CLI 连起来,Claude Code 自己读材料、写文档、发邮件、改表格,完事退出


比如说我收到一份合同,文件会落在我的飞书邮箱里,Claude Code 通过 CLI 把它读出来,对照存好的公司信息和常用条款逐条填好,再生成回执邮件草稿,我看一眼确认没问题发出去,整个过程我只点了一下「发送」


昨天我坐高铁从北京来上海,发现并没啥事儿能做,就让让 Agent 把赛博禅心所有文章爬下来,一共 900 多篇,半个多小时跑完,数据整理进多维表格,甚至能通过「群发触达」这个参数,来追踪过去几年的关注量增长


Agent 时代,如何办公


还生成了十几张可视化图表,也是我第一次能完整看到自己公众号的数据:一共800+次推送,900+篇内容


Agent 时代,如何办公


(OpenAI 前几天宣布 Codex 支持手机遥控了,我估摸着也会把 Codex 改造得趁手一些,先按下不表)


3 月底我写过一篇飞书 CLI 的报道:飞书出了官方 CLI,消息、文档、日历、邮箱都能用 Agent 操作了,而现在这个 CLI 在 GitHub Star 过万了,我已经重度成瘾了,可以聊得更深一点


Agent 进了办公系统


AI 和办公系统的交互方式,过去几年发生过几轮变化


第一轮在 ChatGPT 之前,这时候能用到的模型还叫 davinci-003(你也可以把他叫做 GPT-3)....啊啊啊啊啊啊,我真是赛博老古董,然后这个模型被大家所熟知的 GPT-3.5 取代,并于 24 年初下线


Agent 时代,如何办公


当时有家 AI 公司叫 Jasper,年化营收一度做到上亿美金,7 万多付费用户,算是最早的明星 AI 公司。按现在的话说,“这不就是个 GPT-3 的套壳吗”


Agent 时代,如何办公


它的产品形态是这样的,打开 Jasper 能看到 50 多个模板(Facebook 广告、Google 广告、产品描述、博客大纲、PAS 框架),点开一个,左侧填字段(产品名、描述、目标受众、语气),右侧生成几段候选文案,挑一段复制粘贴到自己的工作环境里


Agent 时代,如何办公


第二轮是 ChatGPT 出来之后。2023 年 2 月 Notion 上线了 Notion AI,把 ChatGPT 的 API 封装成插件嵌进文档里,你在任何一个空 block 上按下空格键,AI 召唤面板就出来


Agent 时代,如何办公


选中已有文字按 Cmd/Ctrl+J,弹出 Ask AI 菜单,里面有「继续写」「改写」「让它更长」「让它更短」「换语气:专业/休闲/直率/友好」「翻译」「总结」「找行动项」「修语法」。AI 在文档当前光标位置直接生成结果,你点 Keep 接受、Discard 丢弃,或者再让它改一次


Agent 时代,如何办公


第三轮是 2023 年下半年到现在,Word、Excel、PowerPoint、Outlook 这些主流办公软件把 AI 以插件或者侧边栏的方式插进了产品里,典型是 Microsoft 365 Copilot


Agent 时代,如何办公


但实际上 Copilot 这玩意儿做的一言难尽,倒是 Claude 做了很多不错的嵌入,之前有聊过:实测:Claude in Excel,能联网、能做表、办公完全自动化;同时 Google Docs 里也做了很好的兼容


Agent 时代,如何办公


而在最近的时间轴里,我们看到了 CLI 的崛起:干活的时候可以完全不打开任何文件,Agent 通过 CLI 自己读、自己写、自己完成,对批量化的工作特别合适。这种趋势在 OpenClaw 爆火后愈演愈烈


就比如开头我举例子的那个例子:邮件进来,Agent 通过 lark-cli mail 读出来,用 lark-cli docs 去文档里找相关材料,写一份回复草稿存进草稿箱,甚至你可以通过飞书 CLI 给众多地址进行批量的邮件发送,就比如在这里我演示的那样:飞书出了官方 CLI,消息、文档、日历、邮箱都能用 Agent 操作了


Agent 时代,如何办公


日历里有个会,Agent 用 lark-cli calendar 查参会人、lark-cli wiki 从知识库里找相关历史,生成议程发到群里;任务到期,Agent 读对应文档,生成进度报告写进多维表格,再起一封汇报邮件


很多繁琐需要来回切换环境的动作,现在通过 CLI 由 Agent 控制,形成了一条非常让人舒爽的通路,甚至我可以在飞书里做备注,然后留给 Agent 帮我修改


Agent 时代,如何办公


之前的几轮变化,AI 都嵌在某个具体的产品里(Jasper 的网页、Notion 的文档、Word 的侧边栏),但在 CLI 这轮中却是反了过来,Agent 通过 CLI 进入用户原本就在用的环境直接干活,然后交付


就比如上文的统计,在运行的过程中,我完全没有打开飞书,更不会说去导入数据到表格里,只是告诉 Claude Code「去搞吧」,它通过 CLI 自己建表、自己定义字段、自己写入记录


Agent 时代,如何办公


多维表格当后台


我有个暴论:Agent 时代,最好用的数据库是多维表格


多维表格这个东西,它既能够给人看,也可以通过 CLI 给 Agent 用,还有对非程序员很友好的 Constraint,这点非常重要。这里差个题外话,之前帮体制内的朋友用 excel 进行全国的业务信息统计,用的是 excel 表格,发出去的是一个版本,收回来的是几百个版本,各种合并单元格与样式美化


我真诚的期盼:能不能把「合并单元格」这个功能,从计算机课本里删掉


Agent 时代,如何办公


限制填表人【在哪个位置】【以怎样的格式填写信息】【并且不该动表格】,真的是一件很麻烦的事儿。并且,在我的实操中,就是把表格冻结了、加上密码了也没用...会有小天才把表格内容复制出来,重新建一份,然后发给你


话说回来,之前我让酒吧里的小伙伴做了个实验:用多维表格控制屏幕切换


Agent 时代,如何办公

在飞书里上传图片


Agent 时代,如何办公

图片会在屏幕中轮播


故事的起因是这样:酒吧里很多块屏幕,过去换图非常麻烦,得登录每块屏幕的后台、上传图片、调位置


Agent 时代,如何办公


那么不妨就用多维表格,把这些图片或者网页的信息记录下来:每块屏幕是多维表格里的一行,字段里放图片或网页链接,我在表格里放了图或者点了某个链接,对应的屏幕就读取并展示


Agent 时代,如何办公


这事儿搞完之后,我就有了个启发:多维表格脱胎于数据库结构,那它能不能直接当数据库用,于是又有了后来的尝试


比如酒吧的库存管理:以打酒机库存为例,能看到里面剩多少酒;酒槽位上加磁控牌,知道每一槽打出去了多少;为此我专门定制了一批能够进行流量控制&监控的酒头,进行实时感知;这些东西如果靠人盯库存经常会过期、会乱,得专人盯,让 AI 接手之后就规整得多


Agent 时代,如何办公


供应商那边也在打通 API:很多的供应链是可以通过 API 的方式进行调用没 API 的就让店长当人肉 API,Agent 通过推送告诉店长今天要进什么货,店长按推送下单,而我可以通过多维表格来监控所有的进度


Agent 时代,如何办公


更进一步的事我也在做:我正在手挫一套硬件,当顾客对它说「我要一杯可乐」或者是「帮我拿包纸」,需求会写进多维表格数据库,然后最近的服务员就会被通知过去;摄像头看到哪儿脏了,也通过表格通知最近的工作人员这样哪些人干了多少活就一目了然了,发绩效也有了依据,当然,以后如果有机器人服务员,也可以通过这套方式调度


Agent 时代,如何办公


作为一个博主,我也在用飞书帮我去追踪最新的信息,比如有啥可能的热点新闻,或者有趣的东西,我都会第一时间收到通知。比如前两天我报道的:马耳他:向全民发放免费 ChatGPT 会员,就是用这套追踪系统监控到的


Agent 时代,如何办公


之前搞一个产品,我都会自己去手搭数据库;而现在的话,我更倾向于用多维表格来做这个:既能给 AI 读,也容易给人读,AI 在背后更新数据,人在前台扫一眼就知道发生了什么


对于 AGI Bar 的活动安排,我也用多维表格记录。一场活动什么时候组织、什么时候举办、多少人参加、产生了哪些照片,全在一张表里,活动结束自动归档。以后我要做一份汇报材料或者展示材料,直接问 Agent 就行。比如:


Agent 时代,如何办公


Agent 从多维表格里读活动数据,从文档里读详细信息和图片,组装成一份海报,当我需要去做对外的活动报告的时候,就非常的方便


飞书 CLI


Claude Code 能进飞书,全靠 CLI 


我是 Claude Code 的忠实用户,非常习惯于拿他操纵各种东西。而这东西能能够介入飞书,完全靠的是 CLI


  • PS:我也是忠实的赛博墙头草,也很有可能调转风向称为 Codex 忠实用户
  • PPS:我个人习惯于手挫各种东西,但大家也可以尝试飞书自带的aily智能伙伴,cli的能力是对齐的


这个项目的地址在这:https://github.com/larksuite/cli


Agent 时代,如何办公


然后这个项目上周拿到了上万 star,目前已经 11.3k 了,这很合理


Agent 时代,如何办公


这东西的核心厉害点在于把每个业务域的能力都做成了 Agent 能直接调用的命令,配上一套给 Agent 用的语义和默认值。具体看它的三层命令架构:


  • 第一层 Shortcut 命令带 + 前缀,比如 +agenda+messages-send+create,人和 Agent 共用,内置智能默认值和 dry-run 预览,日常用这一层就够了;
  • 第二层 API Commands 跟飞书 OpenAPI 一一对应,覆盖 200 多条命令;
  • 第三层 Raw API 可以直接调飞书开放平台的任意端点,覆盖 2500 多个 API,Agent 遇到前两层覆盖不到的场景可以自己找路


Agent 时代,如何办公


每个业务域配一个 Skill,把怎么用这些命令的最佳实践直接教给 Agent。装完 CLI 之后跑一行 npx skills add larksuite/cli -y -g,Agent 就知道该怎么调用了;Agent 调错了 CLI 会告诉它缺什么权限、怎么补,可能产生副作用的命令支持 dry-run 先预览再执行


目前飞书 CLI 覆盖 17 个业务域:消息、文档、多维表格、电子表格、幻灯片、日历、邮件、任务、知识库、通讯录、云空间、会议、妙记、白板、审批、搜索、Markdown,同时这里包含 200 多条命令,这让 Claude Code 这样的外部 Agent 进入飞书的成本变得很低,轻松把整套办公能力接进自己的工作流


办公软件多了一个维度


过去评价办公软件,主要看人用得顺不顺手,比如比如这个文档的交互怎么样、协作怎么样,亦或者是和当前办公环境的集成如何如何


但在 Agent 时代会多一个维度:Agent 能不能快速的接入这个办公软件,完全代替人来高度精准的操作


核心逻辑就是:给人用的是界面,给 AI 用的是接口。下一代办公软件必须具备一个能力,让用户能用自己的 Agent 代替自己完成操作


Agent 时代,如何办公


最后


哎...我已经回不去了


Agent 接住整套办公流程之后,过去那种一切靠手的状态就再也找不回来,文档、合同、表格、邮件、活动、库存都进出于此。对我个人来说,Agent 搭配着最爽的(我自己氪金氪到飞起的),也差不多就是飞书了


Agent 时代,如何办公


我就感觉,自己的整个键盘都长在 Agent 上面,替我干活,办公平台承接和呈现... 可能未来大部分的办公都会变成这个样子


文章来自于"赛博禅心",作者 "金色传说大聪明"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AIExcel公式

【开源免费】smart-excel-ai是一个输入你想要的Excel公式的描述,即可帮你生成对应公式的AI项目

项目地址:https://github.com/weijunext/smart-excel-ai

在线使用:https://www.smartexcel.cc/(付费)

2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT