Simple Document Processing MCP Server

MIT License
21
5

Integrations

  • Provides contact information via GitHub (CabLate) for support and collaboration.

  • Supports HTML to Markdown conversion as part of its document conversion capabilities.

简单文档处理 MCP 服务器

强大的模型上下文协议 (MCP) 服务器提供全面的文档处理功能。

特征

文档阅读器

  • 读取 DOCX、PDF、TXT、HTML、CSV

文档转换

  • DOCX 到 HTML/PDF 的转换
  • HTML 到 TXT/Markdown 的转换
  • PDF 操作(合并、拆分)

文本处理

  • 多编码传输支持(UTF-8、Big5、GBK)
  • 文本格式化和清理
  • 文本比较和差异生成
  • 按行或分隔符分割文本

HTML 处理

  • HTML 清理和格式化
  • 资源提取(图像、链接、视频)
  • 结构保留转换

安装

通过 Smithery 安装

要通过Smithery自动为 Claude Desktop 安装文档处理服务器:

npx -y @smithery/cli install @cablate/mcp-doc-forge --client claude

手动安装

npm install -g @cablate/mcp-doc-forge

用法

命令行

mcp-doc-forge

使用Dive Desktop

  1. 在 Dive Desktop 中点击“+ 添加 MCP 服务器”
  2. 复制并粘贴此配置:
{ "mcpServers": { "searxng": { "command": "npx", "args": [ "-y", "@cablate/mcp-doc-forge" ], "enabled": true } } }
  1. 点击“保存”安装 MCP 服务器

执照

麻省理工学院

贡献

欢迎社区参与和贡献!贡献方式如下:

  • ⭐️ 如果您觉得有用,请为项目加星标
  • 🐛 提交问题:报告问题或提供建议
  • 🔧 创建 Pull 请求:提交代码改进

接触

如果您有任何问题或建议,请随时联系我们:

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

提供全面的文档处理,包括读取、转换和处理各种文档格式以及高级文本和 HTML 处理功能。

  1. Features
    1. Document Reader
    2. Document Conversion
    3. Text Processing
    4. HTML Processing
  2. Installation
    1. Installing via Smithery
    2. Manual Installation
  3. Usage
    1. Cli
    2. With Dive Desktop
  4. License
    1. Contributing
      1. Contact

        Related MCP Servers

        • A
          security
          F
          license
          A
          quality
          Provides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.
          Last updated -
          4
          137,083
          150
          TypeScript
        • A
          security
          A
          license
          A
          quality
          Converts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.
          Last updated -
          10
          16
          987
          TypeScript
          MIT License
        • A
          security
          A
          license
          A
          quality
          Enables text extraction from web pages and PDFs, and execution of predefined commands, enhancing content processing and automation capabilities.
          Last updated -
          3
          TypeScript
          MIT License
        • -
          security
          F
          license
          -
          quality
          Provides tools for reading and extracting text from PDF files, supporting both local files and URLs.
          Last updated -
          3
          Python

        View all related MCP servers

        ID: pb9df6lnel