MCP URL 格式转换器
模型上下文协议 (MCP) 服务器可从任何 URL 获取内容并将其转换为所需的输出格式。
概述
MCP URL 格式转换器提供从任何 Web URL 检索内容并将其转换为各种格式(HTML、JSON、Markdown 或纯文本)的工具,无论原始内容类型如何。它旨在与任何兼容 MCP 的客户端(包括 Claude for Desktop)配合使用,使 LLM 能够以一致的格式访问、转换和分析 Web 内容。
特征
- 🔄格式转换:将任何 Web 内容转换为 HTML、JSON、Markdown 或纯文本
- 🌐通用输入支持:处理网站、API、原始文件等
- 🔍自动内容检测:智能识别源格式
- 🧰强大的库支持:使用行业标准库:
- Cheerio 用于 HTML 解析
- 标记为 Markdown 处理
- 用于 XML 处理的 Fast-XML-Parser
- CSVtoJSON 用于 CSV 转换
- SanitizeHTML 安全性
- 拒绝 HTML 到 Markdown 的转换
- 🔧高级格式处理:
- 使用元数据提取进行 HTML 解析
- JSON 漂亮打印和结构保存
- Markdown 渲染与样式
- CSV 到表格的转换
- XML 到 JSON 的转换
- 📜历史记录跟踪:维护最近获取的 URL 的日志
- 🛡️安全焦点:内容清理以防止 XSS 攻击
安装
先决条件
- Node.js 16.x 或更高版本
- npm 或 yarn
快速入门
- 克隆存储库:
- 安装依赖项:
- 构建项目:
- 运行服务器:
与 Claude for Desktop 集成
- 打开您的 Claude for Desktop 配置文件:
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json
- Windows:
%APPDATA%\Claude\claude_desktop_config.json
- macOS:
- 将 URL 转换器服务器添加到您的配置中:
- 重启 Claude 桌面版
可用工具
fetch
从任何 URL 获取内容并自动检测最佳输出格式。
参数:
url
(字符串,必需):获取内容的 URLformat
(字符串,可选):要转换为的格式(auto
,html
,json
,markdown
,text
)。默认值:auto
例子:
fetch-json
从任何 URL 获取内容并将其转换为 JSON 格式。
参数:
url
(字符串,必需):获取内容的 URLprettyPrint
(布尔值,可选):是否以美观的方式打印 JSON。默认值:true
例子:
fetch-html
从任何 URL 获取内容并将其转换为 HTML 格式。
参数:
url
(字符串,必需):获取内容的 URLextractText
(布尔值,可选):是否仅提取文本内容。默认值:false
例子:
fetch-markdown
从任何 URL 获取内容并将其转换为 Markdown 格式。
参数:
url
(字符串,必需):获取内容的 URL
例子:
fetch-text
从任何 URL 获取内容并将其转换为纯文本格式。
参数:
url
(字符串,必需):获取内容的 URL
例子:
web-search
和deep-research
这些工具为 Perplexity 搜索功能提供接口(当 MCP 主机支持时)。
可用资源
recent-urls://list
返回最近获取的带有时间戳和输出格式的 URL 列表。
例子:
安全
该服务器实施了多项安全措施:
- 使用
sanitize-html
进行 HTML 清理以防止 XSS 攻击 - 处理之前的内容验证
- 错误处理和安全默认值
- 使用 Zod 进行输入参数验证
- 安全输出编码
测试
您可以使用 MCP 检查器测试服务器:
故障排除
常见问题
- 连接错误:验证 URL 是否可访问且格式正确
- 转换错误:某些复杂内容可能无法在格式之间顺利转换
- 跨域问题:某些网站可能会阻止来自未知来源的请求
调试模式
要获取更多调试信息,请设置DEBUG
环境变量:
执照
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅 LICENSE 文件。
致谢
- 使用模型上下文协议构建
- 使用现代的、积极维护的库,并注重安全
- 基于 OWASP 建议的清理方法
最后更新:2025年3月29日
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
模型上下文协议服务器使 LLM 能够获取和处理多种格式(HTML、JSON、Markdown、文本)的 Web 内容,并具有自动格式检测功能。
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol server that allows LLMs to interact with web content through standardized tools, currently supporting web scraping functionality.Last updated -PythonMIT License
- -securityFlicense-qualityA Model Context Protocol server that enables LLMs to extract and use content from unstructured documents across a wide variety of file formats.Last updated -6Python
- AsecurityAlicenseAqualityA Model Context Protocol server that converts various file formats (PDF, PowerPoint, Word, Excel, Images, etc.) to Markdown to make them accessible to LLMs.Last updated -1MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables LLMs to retrieve web content and save it to local files for permanent storage and later access.Last updated -11PythonMIT License