MCP 服务器截图
为 AI 工具提供截图功能的 MCP 服务器,允许其捕获和处理屏幕内容。
概述
这款 MCP 服务器使 AI 工具能够截取用户的屏幕截图,从而使 AI 助手能够查看并分析用户正在查看的内容。该服务器负责图像的捕获、压缩,并以适合 AI 处理的格式进行传输。
特征
截取全屏截图
自动 JPEG 压缩,实现高效传输
Base64 编码图像数据以实现可靠传输
支持 stdio 和 SSE 传输模式
可配置的图像质量和优化
用于测试的简单命令行界面
安装
来自源
# Clone the repository
git clone https://github.com/codingthefuturewithai/screenshot_mcp_server.git
cd screenshot_mcp_server
# Install using UV (recommended)
uv pip install -e .
# Or using pip
pip install -e .
可用工具
截屏
描述:截取用户屏幕的屏幕截图并将其作为 JPEG 图像返回。
参数:无
返回:
JPEG 格式的图像内容,base64 编码
用法
该服务器可以以两种方式使用:
命令行客户端
# Take a screenshot and save it to a file
screenshot_mcp_server-client output.jpg
程序化使用
from mcp import ClientSession, StdioServerParameters
from mcp.client.stdio import stdio_client
async with stdio_client(StdioServerParameters(command="screenshot_mcp_server-server")) as (read, write):
async with ClientSession(read, write) as session:
result = await session.call_tool("take_screenshot")
# Process the screenshot data...
要求
Python 3.10 或更高版本(<3.13)
依赖项:
mcp >= 1.0.0
pyautogui >= 0.9.54
枕头> = 10.0.0
操作系统:Linux、macOS、Windows
配置
服务器支持两种传输模式:
stdio(默认):用于命令行使用
SSE:适用于基于 Web 的应用程序,默认在端口 3001 上运行
要在 SSE 模式下运行:
screenshot_mcp_server-server-sse --port 3001
执照
该项目已获得 MIT 许可。
作者
蒂姆·基钦斯( timkitch@codingthefuture.ai )
Related MCP Servers
- AsecurityAlicenseAqualityAn official MCP server implementation that allows AI assistants to capture website screenshots through the ScreenshotOne API, enabling visual context from web pages during conversations.Last updated -1031MIT License
- AsecurityFlicenseAqualityAn MCP server that provides web development tools including taking screenshots of screens, enabling AI agents to capture and analyze visual content during development.Last updated -2359
- AsecurityAlicenseAqualityAn MCP server providing web development tools such as screen capturing capabilities that let AI agents take and work with screenshots of the user's screen.Last updated -23515MIT License
- AsecurityAlicenseAqualityA macOS utility that captures screenshots and analyzes them with AI vision, enabling AI assistants to see and interpret what's on your screen.Last updated -37,388625MIT License