对话交互

AI 员工如何在对话中反馈工作进度——边做边说的协作体验。

设计理念

和 AI 员工的对话体验应该像和真人同事聊天一样自然。AI 员工不会沉默 2 分钟然后说一句"改好了",而是边做边说,让你随时知道他在干什么。

对话中的反馈

AI 员工执行任务时,每个关键步骤都会作为独立消息出现在对话中:

消息类型展示形式示例
文字消息普通聊天气泡"好的,我来查看一下代码。"
操作状态轻量状态条[在工作电脑上操作中...] 12s
命令摘要终端风格$ git clone https://...
文件操作文件标记写入 /workspace/app.py (42 行)
浏览器操作链接 + 截图浏览 https://mp.weixin.qq.com
截图内嵌图片关键步骤的浏览器截图

好的体验

张小明: 好的,我来查看一下代码。
  $ cd /workspace && ls
  $ cat src/main.py
张小明: 看到了,问题在第 23 行。我来改一下。
  写入 src/main.py (修改第 23 行)
  $ python -m pytest
张小明: 改好了,测试全过。

桌面视角

当 AI 员工在工作电脑上操作时,你可以"看看他在干什么"——就像站在同事身后看屏幕一样。这个功能完全在对话框内完成,不需要跳转页面。

入口

操作状态条上会出现"查看工作过程"入口:

┌────────────────────────────────────┐
│ [在工作电脑上操作中...] 45s          │
│                [查看工作过程 ▼]      │
└────────────────────────────────────┘

展开面板

点击后在对话中展开可折叠面板,包含三个区域:

终端 — 实时显示命令执行和输出:

$ git clone https://gitee.com/xx/yy
Cloning into 'yy'...
$ cd yy && npm install
added 847 packages in 12s
$ npm run build
...构建成功

浏览器 — 实时画面流或截图历史(需要浏览器模板的工作电脑):

  • 实时画面 — AI 员工操作浏览器时可以看到实时画面
  • 截图历史 — 时间线形式展示关键步骤的截图

文件变更 — 显示最近修改或创建的文件列表。

空闲时查看

即使 AI 员工不在工作,你也可以点击头像旁的状态指示器查看工作电脑状态:

  • 工作电脑名称和运行时长
  • CPU 和内存使用情况
  • 工作空间目录内容
  • 最近操作记录

中断任务

如果需要让 AI 员工停下手上的事,点击停止按钮即可。

AI 员工会在收到中断信号后:

  1. 停止当前正在执行的操作
  2. 发一条消息总结当前进度
  3. 等你指示下一步
用户: (点击停止按钮)

系统: [正在请求中止...]

张小明: 收到,我已经停下了。当前进度:
  - 代码已 clone 完成
  - 修改了 2 个文件但还没提交
  你要我继续完成,还是撤销这些改动?

中断是协作式的——AI 员工不会突然消失,而是像真人一样交代清楚现状。

任务插队

如果 AI 员工正在做一件事,而你突然有更紧急的需求,可以直接说。AI 员工会判断情况:

简单问题直接回答

(AI 员工正在跑 npm install)

用户: 现在几点了?

张小明: 现在 14:32。npm install 快好了,稍等。

需要动手的新任务

用户: 等一下,帮我先查一下昨天的部署日志

张小明: 我现在正在帮你跑构建(已完成 npm install,正在编译中)。
        要暂停这边先去查日志吗?

        [暂停当前任务,先查日志]    [不用,等构建完再说]

完成插队任务后,AI 员工会主动回到之前的工作继续。

AI 员工的自主权

AI 员工有清晰的自主权边界,就像真人员工一样:

直接做(不问你)

  • 读代码、查文件
  • 安装小依赖(pip install xxx)
  • 创建分支、提交代码
  • 运行测试

先说再做

  • 安装中等大小的软件
  • 对现有代码做小范围修改

询问后做(等你确认)

  • 安装大型软件
  • 删除文件或目录
  • 推送到 main/master 分支
  • 需要 API Key 或密码
  • 涉及生产环境操作
  • 有多种可选方案时

AI 员工的主动沟通

AI 员工不只是被动等你说话。执行长任务时,他会主动汇报:

时机示例
收到任务后"好的,我来处理,完成后通知你。"
关键节点"代码改好了,正在跑测试。"
需要协助"需要你帮我扫码登录一下。"
遇到异常"构建报错了,看起来是依赖版本问题,我来排查。"
任务完成"搞定了。PR 链接在这里: ..."

IM 通道适配

AI 员工不仅可以在 Web 面板工作,还能通过企微/钉钉/飞书 IM 通道交互。

由于 IM 平台能力有限,交互会自动适配:

功能Web 面板IM 通道
文字对话实时实时
操作过程实时展示每步命令和输出只发送"人话"(开始/完成/异常)
桌面视角可折叠面板不可用,发送 Web 链接
浏览器画面实时画面流发送关键步骤截图
配置按钮可点击按钮文字引导 + Web 链接
中断/插队停止按钮直接发"停一下"/"暂停"

简单说:IM 只收"人话",不收"机器话"。AI 员工在 IM 里像真人一样沟通——"好的我来处理"、"搞定了"、"遇到个问题"——中间的技术细节只在 Web 面板上可见。

通知偏好

你可以配置 IM 通知级别:

  • 仅结果(默认)— 只收开始确认 + 完成汇报 + 需要协助
  • 关键步骤 — 上述 + 关键里程碑通知
  • 全部 — 所有消息都推送(不推荐)

下一步