scraperapi-mcp-server
OfficialScraperAPI MCP 服务器
ScraperAPI MCP 服务器使 LLM 客户端能够使用 ScraperAPI 服务检索和处理网页抓取请求。
目录
功能
完全实现模型上下文协议 (Model Context Protocol) 规范
与 ScraperAPI 无缝集成以进行网页抓取
使用 Python 或 Docker 即可轻松设置
架构
┌───────────────┐ ┌───────────────────────┐ ┌───────────────┐
│ LLM Client │────▶│ Scraper MCP Server │────▶│ AI Model │
└───────────────┘ └───────────────────────┘ └───────────────┘
│
▼
┌──────────────────┐
│ ScraperAPI API │
└──────────────────┘安装
ScraperAPI MCP 服务器旨在作为您机器上的本地服务器运行,您的 LLM 客户端在配置后会自动启动它。
先决条件
Python 3.11+
Docker (可选)
使用 Python
安装软件包:
pip install scraperapi-mcp-server将此内容添加到您的客户端配置文件中:
{
"mcpServers": {
"ScraperAPI": {
"command": "python",
"args": ["-m", "scraperapi_mcp_server"],
"env": {
"API_KEY": "<YOUR_SCRAPERAPI_API_KEY>"
}
}
}
}使用 Docker
将此内容添加到您的客户端配置文件中:
{
"mcpServers": {
"ScraperAPI": {
"command": "docker",
"args": [
"run",
"-i",
"-e",
"API_KEY=${API_KEY}",
"--rm",
"scraperapi-mcp-server"]
}
}
}如果您的命令无法运行(例如,在尝试启动服务器时看到 package not found 错误),请仔细检查您使用的路径。要找到正确的路径,请先激活您的虚拟环境,然后运行:
which <YOUR_COMMAND>API 参考
可用工具
scrape使用 ScraperAPI 从互联网抓取 URL
参数:
url(字符串,必需):要抓取的 URLrender(布尔值,可选):是否使用 JavaScript 渲染页面。默认为False。仅当页面需要 JavaScript 渲染才能显示其内容时,才设置为True。country_code(字符串,可选):激活国家/地区地理定位(ISO 2 位代码)premium(布尔值,可选):激活高级住宅和移动 IPultra_premium(布尔值,可选):激活高级绕过机制。不能与premium同时使用device_type(字符串,可选):设置请求使用mobile(移动端)或desktop(桌面端)用户代理output_format(字符串,可选):允许您指示 API 响应的文件类型应为何种格式。autoparse(布尔值,可选):为特定网站激活自动解析。默认为False。仅当您希望输出格式为csv或json时,才设置为True。
返回:以字符串形式返回抓取的内容
提示词模板
请抓取此 URL
<URL>。如果您收到 500 服务器错误,请识别该网站的地理定位,并添加相应的 country_code 以克服地理限制。如果错误持续存在,请通过添加 premium=true 将请求升级为使用高级代理。对于持续的失败,请激活 ultra_premium=true 以使用增强的反屏蔽措施。您能抓取 URL
<URL>以提取<SPECIFIC_DATA>吗?如果请求返回缺失/不完整的<SPECIFIC_DATA>,请设置 render=true 以启用 JS 渲染。
配置
设置
API_KEY:您的 ScraperAPI API 密钥。
配置 Claude Desktop App & Claude Code
Claude Desktop:
打开 Claude Desktop 并点击设置图标
选择“Developer”(开发者)选项卡
点击“Edit Config”(编辑配置)并粘贴 JSON 配置文件
Claude Code:
使用 JSON 配置文件 将服务器手动添加到您的
.claude/settings.json中,或者运行:claude mcp add scraperapi -e API_KEY=<YOUR_SCRAPERAPI_API_KEY> -- python -m scraperapi_mcp_server
配置 Cursor 编辑器
打开 Cursor
访问设置菜单
打开 Cursor 设置
转到“Tools & Integrations”(工具与集成)部分
点击“+ Add MCP Server”(添加 MCP 服务器)
选择“Manual”(手动)并粘贴 JSON 配置文件
更多信息请见 此处
配置 Windsurf 编辑器
打开 Windsurf
访问设置菜单
点击 Cascade 设置
点击 MCP 服务器部分
点击齿轮图标,
mcp_config.json文件将会打开粘贴 JSON 配置文件
更多信息请见 此处
配置 Cline (VS Code 扩展)
打开 VS Code 并点击活动栏中的 Cline 图标以打开 Cline 面板
点击 Cline 面板顶部导航栏中的 MCP 服务器图标
选择“Configure”(配置)选项卡
点击面板底部的“Configure MCP Servers”(配置 MCP 服务器)——这将打开
cline_mcp_settings.json粘贴 JSON 配置文件
更多信息请见 此处
开发
本地设置
克隆仓库:
git clone https://github.com/scraperapi/scraperapi-mcp cd scraperapi-mcp安装依赖:
使用 Poetry:
poetry install使用 pip:
# Create virtual environment and activate it python -m venv .venv source .venv/bin/activate # MacOS/Linux # OR .venv/Scripts/activate # Windows # Install the local package in editable mode pip install -e .使用 Docker:
# Build the Docker image locally docker build -t scraperapi-mcp-server .
运行服务器
使用 Python:
python -m scraperapi_mcp_server使用 Docker:
# Run the Docker container with your API key docker run -e API_KEY=<YOUR_SCRAPERAPI_API_KEY> scraperapi-mcp-server
调试
python3 -m scraperapi_mcp_server --debug测试
本项目使用 pytest 进行测试。
安装测试依赖
使用 Poetry:
poetry install --with dev使用 pip:
pip install -e . pip install pytest pytest-mock pytest-asyncio
运行测试
# Run All Tests
pytest
# Run Specific Test
pytest <TEST_FILE_PATH>Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/scraperapi/scraperapi-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server