MCP URLフォーマットコンバーター
任意の URL からコンテンツを取得し、必要な出力形式に変換するモデル コンテキスト プロトコル (MCP) サーバー。
概要
MCP URLフォーマットコンバーターは、元のコンテンツの種類を問わず、あらゆるWeb URLからコンテンツを取得し、様々な形式(HTML、JSON、Markdown、プレーンテキスト)に変換するためのツールを提供します。Claude for Desktopを含むあらゆるMCP対応クライアントと連携するように設計されており、LLMは一貫した形式でWebコンテンツにアクセスし、変換および分析できます。
特徴
🔄フォーマット変換: あらゆるウェブコンテンツをHTML、JSON、Markdown、またはプレーンテキストに変換します
🌐ユニバーサル入力サポート:ウェブサイト、API、RAWファイルなどを処理します
🔍自動コンテンツ検出:ソース形式をインテリジェントに識別
🧰堅牢なライブラリサポート:業界標準のライブラリを使用します。
HTML解析用のCheerio
Markdown処理対象としてマーク
XML処理のための高速XMLパーサー
CSV変換のためのCSVtoJSON
セキュリティのためにHTMLをサニタイズする
HTMLからMarkdownへの変換のターンダウン
🔧高度なフォーマット処理:
メタデータ抽出によるHTML解析
JSONの整形印刷と構造の保存
スタイル付きのMarkdownレンダリング
CSVからテーブルへの変換
XMLからJSONへの変換
📜履歴追跡:最近取得したURLのログを保持します
🛡️セキュリティの焦点:XSS攻撃を防ぐためのコンテンツサニタイズ
インストール
前提条件
Node.js 16.x 以上
npmまたはyarn
クイックスタート
リポジトリをクローンします。
git clone https://github.com/yourusername/mcp-url-converter.git cd mcp-url-converter依存関係をインストールします:
npm installプロジェクトをビルドします。
npm run buildサーバーを実行します。
npm start
Claude for Desktopとの統合
Claude for Desktop の構成ファイルを開きます。
macOS:
~/Library/Application Support/Claude/claude_desktop_config.jsonWindows:
%APPDATA%\Claude\claude_desktop_config.json
URL コンバーター サーバーを構成に追加します。
{ "mcpServers": { "url-converter": { "command": "node", "args": ["/absolute/path/to/mcp-url-converter/build/index.js"] } } }デスクトップ版のClaudeを再起動する
利用可能なツール
fetch
任意の URL からコンテンツを取得し、最適な出力形式を自動的に検出します。
パラメータ:
url(文字列、必須): コンテンツを取得するURLformat(文字列, オプション): 変換後のフォーマット (auto、html、json、markdown、text)。デフォルト:auto
例:
fetch-json
任意の URL からコンテンツを取得し、JSON 形式に変換します。
パラメータ:
url(文字列、必須): コンテンツを取得するURLprettyPrint(boolean, オプション): JSONを整形して印刷するかどうか。デフォルト:true
例:
fetch-html
任意の URL からコンテンツを取得し、HTML 形式に変換します。
パラメータ:
url(文字列、必須): コンテンツを取得するURLextractText(ブール値、オプション):テキストコンテンツのみを抽出するかどうか。デフォルト:false
例:
fetch-markdown
任意の URL からコンテンツを取得し、Markdown 形式に変換します。
パラメータ:
url(文字列、必須): コンテンツを取得するURL
例:
fetch-text
任意の URL からコンテンツを取得し、プレーン テキスト形式に変換します。
パラメータ:
url(文字列、必須): コンテンツを取得するURL
例:
web-searchとdeep-research
これらのツールは、Perplexity 検索機能へのインターフェイスを提供します (MCP ホストでサポートされている場合)。
利用可能なリソース
recent-urls://list
タイムスタンプと出力形式を含む最近取得した URL のリストを返します。
例:
安全
このサーバーはいくつかのセキュリティ対策を実装しています。
XSS攻撃を防ぐために
sanitize-htmlを使用してHTMLをサニタイズする処理前のコンテンツ検証
エラー処理と安全なデフォルト
Zodによる入力パラメータ検証
安全な出力エンコーディング
テスト
MCP Inspector を使用してサーバーをテストできます。
トラブルシューティング
よくある問題
接続エラー: URL がアクセス可能であり、正しい形式であることを確認してください
変換エラー: 複雑なコンテンツは、形式間できれいに変換されない場合があります。
クロスオリジンの問題: 一部のウェブサイトでは不明なソースからのリクエストがブロックされる可能性があります
デバッグモード
追加のデバッグ情報については、 DEBUG環境変数を設定します。
ライセンス
このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細については LICENSE ファイルを参照してください。
謝辞
セキュリティを重視した、最新の積極的にメンテナンスされたライブラリを使用します
OWASP の推奨事項に基づくサニタイズアプローチ
最終更新日: 2025年3月29日
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
LLM が自動形式検出を使用して複数の形式 (HTML、JSON、Markdown、テキスト) の Web コンテンツを取得して処理できるようにするモデル コンテキスト プロトコル サーバー。
Related MCP Servers
- -security-license-qualityA Model Context Protocol server that allows LLMs to interact with web content through standardized tools, currently supporting web scraping functionality.Last updated -1MIT License
- -security-license-qualityA Model Context Protocol server that enables LLMs to extract and use content from unstructured documents across a wide variety of file formats.Last updated -6
- Asecurity-licenseAqualityA Model Context Protocol server that converts various file formats (PDF, PowerPoint, Word, Excel, Images, etc.) to Markdown to make them accessible to LLMs.Last updated -1MIT License
- Asecurity-licenseAqualityA Model Context Protocol server that enables LLMs to retrieve web content and save it to local files for permanent storage and later access.Last updated -11MIT License