对话交互
AI 员工如何在对话中反馈工作进度——边做边说的协作体验。
设计理念
和 AI 员工的对话体验应该像和真人同事聊天一样自然。AI 员工不会沉默 2 分钟然后说一句"改好了",而是边做边说,让你随时知道他在干什么。
对话中的反馈
AI 员工执行任务时,每个关键步骤都会作为独立消息出现在对话中:
| 消息类型 | 展示形式 | 示例 |
|---|---|---|
| 文字消息 | 普通聊天气泡 | "好的,我来查看一下代码。" |
| 操作状态 | 轻量状态条 | [在工作电脑上操作中...] 12s |
| 命令摘要 | 终端风格 | $ git clone https://... |
| 文件操作 | 文件标记 | 写入 /workspace/app.py (42 行) |
| 浏览器操作 | 链接 + 截图 | 浏览 https://mp.weixin.qq.com |
| 截图 | 内嵌图片 | 关键步骤的浏览器截图 |
好的体验:
张小明: 好的,我来查看一下代码。
$ cd /workspace && ls
$ cat src/main.py
张小明: 看到了,问题在第 23 行。我来改一下。
写入 src/main.py (修改第 23 行)
$ python -m pytest
张小明: 改好了,测试全过。
桌面视角
当 AI 员工在工作电脑上操作时,你可以"看看他在干什么"——就像站在同事身后看屏幕一样。这个功能完全在对话框内完成,不需要跳转页面。
入口
操作状态条上会出现"查看工作过程"入口:
┌────────────────────────────────────┐
│ [在工作电脑上操作中...] 45s │
│ [查看工作过程 ▼] │
└────────────────────────────────────┘
展开面板
点击后在对话中展开可折叠面板,包含三个区域:
终端 — 实时显示命令执行和输出:
$ git clone https://gitee.com/xx/yy
Cloning into 'yy'...
$ cd yy && npm install
added 847 packages in 12s
$ npm run build
...构建成功
浏览器 — 实时画面流或截图历史(需要浏览器模板的工作电脑):
- 实时画面 — AI 员工操作浏览器时可以看到实时画面
- 截图历史 — 时间线形式展示关键步骤的截图
文件变更 — 显示最近修改或创建的文件列表。
空闲时查看
即使 AI 员工不在工作,你也可以点击头像旁的状态指示器查看工作电脑状态:
- 工作电脑名称和运行时长
- CPU 和内存使用情况
- 工作空间目录内容
- 最近操作记录
中断任务
如果需要让 AI 员工停下手上的事,点击停止按钮即可。
AI 员工会在收到中断信号后:
- 停止当前正在执行的操作
- 发一条消息总结当前进度
- 等你指示下一步
用户: (点击停止按钮)
系统: [正在请求中止...]
张小明: 收到,我已经停下了。当前进度:
- 代码已 clone 完成
- 修改了 2 个文件但还没提交
你要我继续完成,还是撤销这些改动?
中断是协作式的——AI 员工不会突然消失,而是像真人一样交代清楚现状。
任务插队
如果 AI 员工正在做一件事,而你突然有更紧急的需求,可以直接说。AI 员工会判断情况:
简单问题直接回答:
(AI 员工正在跑 npm install)
用户: 现在几点了?
张小明: 现在 14:32。npm install 快好了,稍等。
需要动手的新任务:
用户: 等一下,帮我先查一下昨天的部署日志
张小明: 我现在正在帮你跑构建(已完成 npm install,正在编译中)。
要暂停这边先去查日志吗?
[暂停当前任务,先查日志] [不用,等构建完再说]
完成插队任务后,AI 员工会主动回到之前的工作继续。
AI 员工的自主权
AI 员工有清晰的自主权边界,就像真人员工一样:
直接做(不问你):
- 读代码、查文件
- 安装小依赖(pip install xxx)
- 创建分支、提交代码
- 运行测试
先说再做:
- 安装中等大小的软件
- 对现有代码做小范围修改
询问后做(等你确认):
- 安装大型软件
- 删除文件或目录
- 推送到 main/master 分支
- 需要 API Key 或密码
- 涉及生产环境操作
- 有多种可选方案时
AI 员工的主动沟通
AI 员工不只是被动等你说话。执行长任务时,他会主动汇报:
| 时机 | 示例 |
|---|---|
| 收到任务后 | "好的,我来处理,完成后通知你。" |
| 关键节点 | "代码改好了,正在跑测试。" |
| 需要协助 | "需要你帮我扫码登录一下。" |
| 遇到异常 | "构建报错了,看起来是依赖版本问题,我来排查。" |
| 任务完成 | "搞定了。PR 链接在这里: ..." |
IM 通道适配
AI 员工不仅可以在 Web 面板工作,还能通过企微/钉钉/飞书 IM 通道交互。
由于 IM 平台能力有限,交互会自动适配:
| 功能 | Web 面板 | IM 通道 |
|---|---|---|
| 文字对话 | 实时 | 实时 |
| 操作过程 | 实时展示每步命令和输出 | 只发送"人话"(开始/完成/异常) |
| 桌面视角 | 可折叠面板 | 不可用,发送 Web 链接 |
| 浏览器画面 | 实时画面流 | 发送关键步骤截图 |
| 配置按钮 | 可点击按钮 | 文字引导 + Web 链接 |
| 中断/插队 | 停止按钮 | 直接发"停一下"/"暂停" |
简单说:IM 只收"人话",不收"机器话"。AI 员工在 IM 里像真人一样沟通——"好的我来处理"、"搞定了"、"遇到个问题"——中间的技术细节只在 Web 面板上可见。
通知偏好
你可以配置 IM 通知级别:
- 仅结果(默认)— 只收开始确认 + 完成汇报 + 需要协助
- 关键步骤 — 上述 + 关键里程碑通知
- 全部 — 所有消息都推送(不推荐)