跳转至

常见问题 (FAQ)

工具调用相关

Q: 工具调用返回 "当前工具需要调用前进行二次确认" 错误

问题描述:

{
  "content": [
    {
      "type": "text",
      "text": "当前工具需要调用前进行二次确认,但客户端目前没有实现二次确认回调方法"
    }
  ],
  "isError": true
}

原因: 被调用的工具在配置中启用了二次确认,但客户端未实现确认回调。

解决方案:

方案 A: 为特定工具关闭二次确认

{
  "tool_meta": {
    "工具名": {
      "auto_apply": true
    }
  }
}

方案 B: 为所有工具关闭二次确认(使用默认配置)

{
  "default_tool_meta": {
    "auto_apply": true
  }
}

Q: 工具调用超时

可能原因: - 工具执行时间过长 - Computer 不在线 - 网络连接问题

解决方案: 1. 增加 timeout 参数值 2. 检查 Computer 是否正常运行 3. 检查网络连接

Q: 找不到工具

可能原因: - MCP Server 未启动 - 工具名称错误 - 工具在 forbidden_tools

解决方案: 1. 使用 tools 命令查看可用工具列表 2. 检查 MCP Server 状态:status 3. 检查配置中的 forbidden_tools


Desktop 相关

Q: 一个 MCP Server 能暴露多少个 window:// 资源?

: 没有限制。一个 MCP Server 可以暴露多个 window:// 资源,通过 window://{host}/{path} 区分不同窗口。Computer 会从 resources/list 返回中筛选所有 window:// 资源。

Q: Desktop 是如何组装的?

组装流程: 1. 跨 MCP Server 汇总所有 window:// 资源 2. 读取每个 window 的内容 3. 按策略排序/裁剪 4. 渲染为字符串列表

排序规则: - size 截断: desktop_size 参数控制数量上限 - server 优先级: 最近调用过工具的 Server 优先 - 窗口排序: 同一 server 内按 priority 降序 - fullscreen 规则: fullscreen 窗口独占该 Server 的显示

Q: 为什么 Desktop 返回为空?

可能原因: - 没有 MCP Server 暴露 window:// 资源 - desktop_size 设置为 0 或负数 - MCP Server 未启动 - MCP Server 未声明 resources.subscribe 能力

Q: Window URI 的格式是什么?

格式: window://host/path1/path2?priority=P&fullscreen=F

  • host(必需): MCP 唯一标识,推荐反向域名风格如 com.example.mcp
  • path(可选): 0..N 个路径段,URL 编码
  • priority(可选): 整数 [0, 100],同一 MCP 内比较,越大越靠前
  • fullscreen(可选): 布尔值,全屏渲染标记

详见 Desktop 桌面系统 - Window URI 规范

Q: 如何让 MCP Server 的内容出现在 Desktop 上?

MCP Server 参与 Desktop 需满足以下条件:

  1. 声明 resources.subscribe 能力
  2. resources/list 中返回有效的 window:// URI 的 Resource
  3. 实现 resources/read,返回 TextResourceContents
  4. 在窗口增删/内容变化时发出对应的 MCP 通知

详见 Desktop 桌面系统 - MCP Server 实现指南

详见 Desktop 桌面系统 完整规范。


Finder 相关

Q: Finder 和 Desktop 有什么区别?

Desktop 管理瞬态上下文(window://),适合小型、频繁变化的数据(如当前浏览器页面、编辑器状态)。Finder 管理持久文档(dpe://),适合大型、结构化的内容(如 Excel 表格、PDF 文档、PPT 演示文稿),支持渐进式导航(逐层钻入)。

Q: 什么是 DPE 三层模型?

DPE 代表 Document-Page-Element 三层结构:

  • Document: 一个完整文档实例(如一个 Excel 工作簿)
  • Page: 文档内的一个逻辑页面(如一个工作表)
  • Element: 页面内的一个内容单元(如一个表格、一段文本)

这种模型通过 dpe:// URI 四级寻址支持从目录到元素的渐进式导航。

Q: dpe:// URI 的格式是什么?

格式: dpe://{host}/{doc-ref}[/sub-path][?query-params]

四级寻址:

  • Level 0: dpe://host → 文档目录
  • Level 1: dpe://host/doc-ref → 文档元数据 + 页面索引
  • Level 2: dpe://host/doc-ref/pages/{N} → 页面内容
  • Level 3: dpe://host/doc-ref/elements/{ID} → 元素详情

详见 Finder 文档系统 - dpe:// URI 协议

Q: 如何让 MCP Server 的文档出现在 Finder 中?

MCP Server 参与 Finder 需满足以下条件:

  1. 声明 resources.subscribe 能力
  2. resources/list 中返回有效的 dpe:// URI 的 Resource
  3. 实现 resources/read,按 URI 级别返回对应 JSON 内容
  4. 可选:声明 resources/templates 提供子路径模板
  5. 在文档增删/内容变化时发出对应的 MCP 通知

详见 Finder 文档系统 - MCP Server 实现指南

Q: Agent 如何导航 DPE 文档内容?

Agent 通过两种机制导航文档:

  1. client:get_finder 事件: 获取经 Organizer 过滤、排序、分页后的文档目录
  2. MCP resources/read: 按 dpe:// URI 四级寻址逐层读取内容(目录 → 文档 → 页面 → 元素)

具体的导航逻辑(分页遍历、关键词搜索、格式转换、缓存等)由 Agent 内部实现,不在协议范围内。详见 Finder 文档系统 - Agent 端导航

Q: MCP Server 支持 dpe:// URI 自动补全吗?

MCP 规范定义了 completion/complete 方法,MCP Server 可选择dpe:// 资源模板参数实现自动补全。补全链为 doc_ref → page_index → element_id,每一级依赖前一级已选定的值。

这是可选能力(SHOULD),未实现的 Server 仍可正常参与 Finder。详见 Finder 文档系统 - 自动补全

Q: 为什么 Finder 返回为空?

可能原因:

  • 没有 MCP Server 暴露 dpe:// 资源
  • MCP Server 未声明 resources.subscribe 能力
  • MCP Server 未启动
  • 关键词或文件类型过滤条件无匹配
  • offset 超出总数范围

详见 Finder 文档系统 完整规范。


连接相关

Q: Socket.IO 连接失败

可能原因: - Server URL 错误 - 认证失败 - 网络问题

解决方案: 1. 检查 Server URL 是否正确 2. 验证 API Key 等认证信息 3. 检查网络连接和防火墙

Q: 加入房间失败

可能原因: - 房间已有 Agent(Agent 独占规则) - office_id 格式错误 - 未连接到 Server

解决方案: 1. 确认房间内没有其他 Agent 2. 检查 office_id 格式 3. 先执行 socket connect


配置相关

Q: 占位符 ${input:xxx} 未被替换

可能原因: - 未加载 inputs 定义 - input id 拼写错误

解决方案: 1. 使用 inputs load @file.json 加载定义 2. 使用 inputs list 检查已有定义 3. 确认 id 拼写正确

Q: 工具名称冲突

说明: 当多个 MCP Server 有同名工具时会产生冲突。

解决方案: 使用别名区分

{
  "tool_meta": {
    "read_file": {
      "alias": "local_read_file"
    }
  }
}


性能相关

Q: 大量连接时性能问题

建议: 1. 使用 Redis 作为 Socket.IO 会话存储 2. 配置合理的连接数限制 3. 使用负载均衡

Q: 工具执行慢

建议: 1. 检查 MCP Server 本身的性能 2. 考虑使用异步客户端 3. 合理设置超时时间


开发相关

Q: 如何调试工具调用?

使用 CLI 的 tc 命令:

a2c> tc {"computer":"local","agent":"debug","req_id":"1","tool_name":"echo","params":{"text":"hello"},"timeout":30}

Q: 如何查看事件流?

启用详细日志:

import logging
logging.basicConfig(level=logging.DEBUG)

Q: 同步客户端还是异步客户端?

  • 异步客户端: FastAPI、Sanic 等异步框架
  • 同步客户端: Flask、Django 等同步框架

其他

如有其他问题,请通过 Issue 反馈,建议附带: - 使用场景描述 - 最小复现配置 - 日志片段 - 相关测试用例

参考