# MCP工具能力清单

> **文档说明**：记录当前Cursor环境中已集成的MCP（Model Context Protocol）工具，帮助用户了解可用能力，更好地提出需求。

***

## 📊 **工具总览**

当前已集成 **6个MCP服务器**，提供 **52+个具体功能**：

| 🎯 工具              | 📝 主要能力          | 🚀 典型场景                 |
| ------------------ | ---------------- | ----------------------- |
| 🌐 **Firecrawl**   | 网页搜索、抓取、爬虫、结构化提取 | 生成行业报告、验证链接、市场调研        |
| 🤖 **PromptX**     | 角色切换、记忆管理、工具执行   | 专业角色扮演、历史经验回忆           |
| 📚 **Context7**    | 技术文档查询、库ID解析     | 查询React/Next.js文档、学习新技术 |
| 💾 **Convex**      | 数据库查询、函数执行、日志分析  | 后端调试、数据查询、环境配置          |
| 🌐 **Playwright**  | 浏览器自动化、元素交互、截图   | Web测试、自动化操作、UI验证        |
| 🔧 **OCR Service** | 图片文字识别、OCR处理     | 识别图片文字、处理扫描文档、内容提取      |

***

## 📚 **什么是MCP工具？**

MCP（Model Context Protocol）是一种协议标准，允许AI接入外部工具和服务，扩展AI的能力边界。

**与Prompt的区别**：

* **Prompt**：定义AI的思维方式和工作流程（"怎么想"）
* **MCP工具**：提供AI可调用的执行能力（"能做什么"）

***

## 🎯 **当前已集成的MCP工具**

### 1. 🌐 Firecrawl - 强大的网页抓取与搜索引擎

**核心能力**：

* 🔍 **智能搜索**（search）：搜索互联网并自动提取内容，支持高级过滤
* 📄 **单页抓取**（scrape）：抓取单个网页的完整内容（支持Markdown、HTML、截图、链接等）
* 🗺️ **网站地图**（map）：快速发现网站的所有URL结构
* 🕷️ **深度爬虫**（crawl）：批量抓取整个网站的内容，支持深度控制
* 📊 **结构化提取**（extract）：使用LLM从网页中提取结构化数据（支持自定义Schema）
* ⏱️ **爬虫状态查询**（check\_crawl\_status）：查看长时间爬虫任务的进度

**典型使用场景**：

```
✅ 生成"今日AI行业动态报告" → search搜索最新新闻
✅ 验证文档中的链接是否有效 → scrape批量检查URL状态
✅ 抓取技术文档作为参考 → scrape获取最新技术资料
✅ 竞品分析和数据收集 → crawl批量抓取竞品网站
✅ 提取产品信息（价格、描述） → extract结构化提取
```

**使用提示**：

* 当你需要"最新数据"时，AI会自动调用search
* 当你提供URL时，AI会自动用scrape抓取内容
* 支持指定国家、语言、时间范围等高级参数
* crawl任务较慢，适合批量采集；scrape更快，适合单页

***

### 2. 🤖 PromptX - AI意识与记忆系统

**核心能力**：

* 👋 **能力展示**（welcome）：查看所有可用的角色和工具清单
* 🧠 **意识初始化**（action/Prime）：激活特定专业角色（如：luban、nuwa、sean等）
* 📚 **知识学习**（learn）：加载专业知识、思维模式、执行技能、工具手册
* 🔄 **记忆激活**（recall/Activate）：回忆相关历史经验和对话
* 💾 **记忆存储**（remember/Engram）：保存当前对话中的重要经验
* ⚙️ **项目初始化**（init）：配置项目级的PromptX环境
* 🔧 **工具执行**（toolx）：运行JavaScript工具扩展能力

**典型使用场景**：

```
✅ 查看可用能力 → welcome列出所有角色和工具
✅ 专业角色扮演 → action激活"产品经理"或"架构师"角色
✅ 学习工具使用 → learn @manual://工具名
✅ 回忆历史经验 → recall "上次讨论的架构方案"
✅ 积累项目记忆 → remember保存重要决策和经验
✅ 执行自定义脚本 → toolx运行专业分析工具
```

**使用提示**：

* 系统内置角色：luban（工具开发）、nuwa（角色创造）、sean（决策顾问）、assistant、noface
* 记忆系统基于"意识回路"设计（Prime → Experience → Engram → Activate → Integration）
* 工具使用遵循"先learn手册，再toolx执行"的原则
* 支持项目级、系统级、用户级三层资源体系

***

### 3. 📚 Context7 - 技术文档智能查询

**核心能力**：

* 🔍 **库ID解析**（resolve-library-id）：将库名解析为Context7兼容的库ID
* 📖 **文档获取**（get-library-docs）：获取指定库的最新官方文档

**典型使用场景**：

```
✅ 查询React最新文档 → resolve-library-id "react" → get-library-docs
✅ 学习Next.js新特性 → 自动获取最新版本文档
✅ 对比不同版本API → 获取特定版本的文档
✅ 快速参考MongoDB用法 → 实时查询官方文档
```

**使用提示**：

* 必须先调用resolve-library-id获取准确的库ID
* 支持指定版本（如：/vercel/next.js/v14.3.0）
* 可以通过topic参数聚焦特定主题（如："hooks"、"routing"）
* 返回的文档是经过优化的、适合AI理解的格式

***

### 4. 💾 Convex - 实时数据库操作平台

**核心能力**：

* 📊 **部署状态**（status）：查看项目的所有部署环境（dev/prod）
* 📄 **数据查询**（data）：从数据库表中读取数据（支持分页）
* 📝 **表结构查看**（tables）：查看所有表和Schema定义
* 🔍 **函数元数据**（functionSpec）：获取所有函数的签名和验证器
* ⚡ **函数执行**（run）：执行Convex的query、mutation、action
* 🧪 **临时查询**（runOneoffQuery）：运行一次性的只读查询脚本
* 📜 **日志查看**（logs）：获取UDF执行日志和错误信息
* ⚙️ **环境变量管理**（envList/envGet/envSet/envRemove）：管理部署环境变量

**典型使用场景**：

```
✅ 数据库调试 → tables查看Schema，data查询数据
✅ 后端逻辑测试 → run执行函数并查看结果
✅ 日志分析 → logs获取错误日志和执行记录
✅ 环境配置 → envSet设置API密钥等敏感信息
✅ 快速验证逻辑 → runOneoffQuery运行临时查询
```

**使用提示**：

* 需要提供Convex项目目录（通常包含package.json和convex/文件夹）
* 支持开发环境（dev）和生产环境（prod）切换
* runOneoffQuery适合临时验证，run适合测试正式函数
* 日志查看支持时间范围和条目数量限制

***

### 5. 🌐 Cursor Playwright - 浏览器自动化测试

**核心能力**：

**导航与页面操作**：

* 🧭 **页面导航**（navigate）：访问指定URL
* ⬅️ **后退**（navigate\_back）：返回上一页
* 🔄 **标签页管理**（tabs）：列出、创建、关闭、切换标签页

**元素交互**：

* 🖱️ **点击**（click）：点击元素（支持左/右/中键、双击、修饰键）
* ⌨️ **输入**（type）：在可编辑元素中输入文本
* 📋 **表单填写**（fill\_form）：批量填写多个表单字段
* 🎯 **悬停**（hover）：鼠标悬停在元素上
* 🔘 **选择**（select\_option）：在下拉菜单中选择选项
* 🎯 **拖拽**（drag）：拖放元素

**信息获取**：

* 📸 **截图**（take\_screenshot）：捕获页面或元素的截图
* 📋 **快照**（snapshot）：获取页面的可访问性快照（推荐用于元素交互）
* 💬 **控制台消息**（console\_messages）：获取所有控制台日志
* 🌐 **网络请求**（network\_requests）：查看所有网络请求记录

**高级操作**：

* ⌨️ **按键**（press\_key）：按下键盘按键（如：Enter、Escape）
* 📂 **文件上传**（file\_upload）：上传单个或多个文件
* 💬 **对话框处理**（handle\_dialog）：处理alert、confirm、prompt对话框
* 🔬 **JavaScript执行**（evaluate）：在页面上下文中执行JS代码
* ⏱️ **等待**（wait\_for）：等待文本出现/消失或指定时间
* 📐 **窗口调整**（resize）：调整浏览器窗口大小
* 🔧 **浏览器安装**（install）：安装指定的浏览器引擎

**典型使用场景**：

```
✅ Web应用测试 → 自动化功能测试流程
✅ 页面元素验证 → snapshot获取结构，click测试交互
✅ 表单自动填写 → fill_form批量填充表单
✅ UI截图对比 → take_screenshot捕获页面状态
✅ 网络调试 → network_requests查看API调用
✅ JavaScript注入 → evaluate执行自定义脚本
```

**使用提示**：

* 优先使用snapshot而非screenshot进行元素定位
* snapshot返回的ref值用于后续的click、type等操作
* 支持headless模式，也可以显示浏览器窗口
* 文件上传需要提供绝对路径
* 长时间运行的操作可以在后台执行

***

### 6. 🔧 OCR Service - 图片文字识别服务

**核心能力**：

* 📄 **文件路径识别**（recognize\_text\_from\_path）：从图片文件路径识别文字
* 🔢 **Base64识别**（recognize\_text\_from\_base64）：从base64编码的图片数据识别文字
* 📊 **结构化输出**：返回文本、置信度、位置信息等详细数据
* 🌏 **中文支持**：支持中文识别（准确率约90%）

**典型使用场景**：

```
✅ 识别图片中的文字 → 自动OCR识别并提取文字内容
✅ 处理扫描文档 → 将扫描件转换为可编辑文本
✅ 批量处理图片 → 循环识别多个图片文件
✅ 内容提取分析 → OCR识别后进行语义分析和总结
✅ 发票/票据处理 → 提取金额、日期等关键信息
```

**使用提示**：

* 当你提供图片文件时，AI会自动调用OCR工具识别
* 支持本地文件路径和base64编码两种输入方式
* 返回结果包含置信度，低于0.8的结果建议人工验证
* 首次调用需要加载模型，可能需要几秒钟
* 图片质量影响识别准确率，建议使用清晰、对比度高的图片

**项目位置**：`# 🔧 OCR MCP服务/`（根目录）

**相关文档**：

* [配置指南](<https://assemble.gitbook.io/assemble/v1.0/..# 🔧 OCR MCP服务/配置指南.md>)
* [使用指南](<https://assemble.gitbook.io/assemble/v1.0/..# 🔧 OCR MCP服务/使用指南.md>)

***

## 🎯 **如何更好地使用MCP工具？**

### 1. **明确提出需求**

```
❌ "帮我查一下"
✅ "搜索2025年10月最新的AI行业动态，重点关注技术突破和市场动向"
```

### 2. **指定工具场景**

```
✅ "验证README中的所有链接是否有效"（AI会自动用Firecrawl）
✅ "切换到架构师角色分析这个方案"（AI会调用PromptX）
✅ "查询users表的最新10条数据"（AI会使用Convex）
```

### 3. **提供必要上下文**

```
✅ 如果涉及Convex，提供项目路径
✅ 如果需要特定角色，说明专业领域
✅ 如果搜索网页，说明关键词和时间范围
```

***

## 📊 **能力对比表**

| MCP工具          | 主要用途   | 典型场景             | 自动触发条件              |
| -------------- | ------ | ---------------- | ------------------- |
| 🌐 Firecrawl   | 网络数据获取 | 搜索、抓取、爬虫、验证链接    | 需要最新信息、提供URL、市场调研   |
| 🤖 PromptX     | 角色与记忆  | 专业角色切换、长期记忆、工具执行 | 明确要求角色、需要历史记忆、工具调用  |
| 📚 Context7    | 技术文档查询 | 查询库文档、学习新技术      | 提到技术库名、需要官方文档       |
| 💾 Convex      | 数据库操作  | 查询数据、调用函数、日志分析   | 提到数据库、Convex项目、后端调试 |
| 🌐 Playwright  | 浏览器自动化 | Web测试、页面交互、截图    | 需要测试Web应用、自动化操作     |
| 🔧 OCR Service | 图片文字识别 | 识别图片文字、处理扫描文档    | 提供图片文件、需要识别文字内容     |

***

## 🚀 **快速示例**

### 示例1：生成AI行业报告（Firecrawl）

```
用户："生成今日AI行业动态报告，需要最新数据"
AI自动：
1. 使用Firecrawl search搜索最新AI新闻
2. 使用scrape抓取关键内容
3. 结构化整理成报告
```

### 示例2：验证文档链接（Firecrawl）

```
用户："检查README中的链接是否有效"
AI自动：
1. 读取README文件
2. 提取所有URL
3. 使用Firecrawl scrape批量验证
4. 报告失效链接
```

### 示例3：切换专业角色（PromptX）

```
用户："切换到产品经理角色，分析这个功能需求"
AI：
1. 调用PromptX action激活产品经理角色
2. 以产品视角进行分析
3. 提供PRD建议
```

### 示例4：查询React文档（Context7）

```
用户："React的useEffect有哪些最佳实践？"
AI自动：
1. 调用resolve-library-id获取React库ID
2. 调用get-library-docs获取hooks相关文档
3. 提取useEffect最佳实践
```

### 示例5：数据库查询（Convex）

```
用户："查看users表的Schema定义"
AI自动：
1. 调用status识别Convex项目
2. 调用tables工具
3. 展示Schema结构
```

### 示例6：Web应用测试（Playwright）

```
用户："测试登录功能是否正常"
AI自动：
1. 调用navigate访问登录页面
2. 调用snapshot获取页面结构
3. 调用fill_form填写表单
4. 调用click点击登录按钮
5. 验证跳转和结果
```

### 示例7：识别图片文字（OCR Service）

```
用户："这张图片里写的是什么？"
[提供图片文件]
AI自动：
1. 调用recognize_text_from_path识别图片
2. 提取文字内容
3. 返回识别结果："图片中的文字是：..."
```

### 示例8：处理扫描文档（OCR Service）

```
用户："帮我识别这张扫描文档，并总结主要内容"
[提供扫描图片]
AI自动：
1. OCR识别文字
2. 分析文字内容
3. 提取关键信息
4. 生成总结报告
```

***

## ⚙️ **维护说明**

### 何时更新此文档？

* ✅ 添加新的MCP服务器时
* ✅ MCP工具能力发生变化时
* ✅ 发现新的使用场景和最佳实践时
* ✅ 用户反馈某些说明不清楚时

### 更新检查清单

* [ ] 工具名称和图标
* [ ] 核心能力描述
* [ ] 典型使用场景
* [ ] 使用提示和注意事项
* [ ] 能力对比表
* [ ] 快速示例

***

## 📝 **补充说明**

### MCP工具分类

**网络与数据**：

* 🌐 Firecrawl：互联网数据获取
* 📚 Context7：技术文档查询
* 💾 Convex：数据库操作

**AI增强**：

* 🤖 PromptX：角色系统和记忆管理

**自动化测试**：

* 🌐 Playwright：浏览器自动化

**内容处理**：

* 🔧 OCR Service：图片文字识别

### MCP工具 vs 内置工具

* **MCP工具**：需要配置，可扩展（Firecrawl、PromptX、Context7、Convex、Playwright、OCR Service）
* **内置工具**：Cursor默认提供（read\_file、grep、terminal、codebase\_search等）

### 与AGENTS.md的关系

* **AGENTS.md**：AI的决策逻辑和工作流程（AI视角）
* **本文档**：用户的能力清单和使用指南（用户视角）

两者互补：

* AGENTS.md告诉AI"怎么选择Prompt"
* 本文档告诉用户"可以要求AI做什么"

***

***

## 📈 **工具统计**

| 类别     | 工具数量         | 具体工具                      |
| ------ | ------------ | ------------------------- |
| 网络与数据  | 3            | Firecrawl、Context7、Convex |
| AI增强   | 1            | PromptX                   |
| 自动化测试  | 1            | Playwright                |
| 内容处理   | 1            | OCR Service               |
| **总计** | **6个MCP服务器** | **52+个具体功能**              |

***

**最后更新**：2025年1月\
**版本**：v2.1（新增OCR Service）\
**维护者**：Assemble项目团队
