PDF Document MCP Server
PDFドキュメントMCPサーバー
By MEOK AI Labs | meok.ai
AIエージェント向けのドキュメント処理ツールキット。外部APIに依存せず、すべてローカル環境でテキスト抽出、Markdown変換、PDF結合、テーブル抽出、ドキュメント要約を行います。
ツール
ツール | 説明 |
| PDFの全ページまたは特定のページからテキストを抽出 |
| 見出し検出機能付きでPDFを構造化されたMarkdownに変換 |
| 複数のPDFファイルを1つのドキュメントに結合 |
| 位置分析を使用してPDFページからテーブル構造を抽出 |
| メタデータ、統計、見出し、ページごとの要約を生成 |
インストール
pip install mcp PyMuPDF外部サービス、APIキー、クラウドへの依存関係は一切ありません。すべての処理はローカルで行われます。
使用方法
サーバーの実行
python server.pyClaude Desktopの設定
{
"mcpServers": {
"pdf-document": {
"command": "python",
"args": ["/path/to/pdf-document-mcp/server.py"]
}
}
}呼び出し例
PDFからテキストを抽出:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf"}
Output: {"total_pages": 12, "total_characters": 48320, "pages": [{"page": 1, "text": "...", "char_count": 4210}, ...]}特定のページのみ抽出:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf", "pages": [1, 3, 5]}
Output: {"extracted_pages": 3, "pages": [...]}PDFをMarkdownに変換:
Tool: convert_pdf_to_markdown
Input: {"file_path": "/Users/me/documents/whitepaper.pdf"}
Output: {"markdown": "# whitepaper.pdf\n\n---\n## Page 1\n\n### Introduction\n\nThis paper presents...", "char_count": 15200}テーブルを抽出:
Tool: extract_tables
Input: {"file_path": "/Users/me/documents/financials.pdf", "page_num": 3}
Output: {"tables_found": 2, "tables": [{"header": ["Quarter", "Revenue", "Profit"], "rows": [["Q1", "$1.2M", "$400K"], ...]}]}複数のPDFを結合:
Tool: merge_pdfs
Input: {"file_paths": ["/tmp/part1.pdf", "/tmp/part2.pdf", "/tmp/part3.pdf"], "output_path": "/tmp/combined.pdf"}
Output: {"output": "/tmp/combined.pdf", "total_pages": 28}ドキュメントを要約:
Tool: summarize_document
Input: {"file_path": "/Users/me/documents/thesis.pdf"}
Output: {"statistics": {"total_pages": 45, "total_words": 12500, "total_images": 8}, "headings": [...], "metadata": {"author": "...", "title": "..."}}料金
プラン | 制限 | 価格 |
Free | 1日20回まで | $0 |
Pro | 無制限 + OCRサポート + バッチ処理 | $9/月 |
Enterprise | カスタム + 優先サポート | お問い合わせ |
ライセンス
MIT
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/CSOAI-ORG/pdf-document-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server