UniProt MCP サーバー
UniProtタンパク質データベースへの高度なアクセスを提供する包括的なモデルコンテキストプロトコル(MCP)サーバー。このサーバーは26種類の専門的なバイオインフォマティクスツールを提供し、AIアシスタントとMCPクライアントはUniProtのREST APIを介して、高度なタンパク質研究、比較ゲノミクス、構造生物学解析、システム生物学調査を直接実行できます。
Augmented Natureによって開発
特徴
コアタンパク質分析(5つのツール)
- タンパク質検索: UniProtデータベースをタンパク質名、キーワード、生物名で検索します
- 詳細なタンパク質情報: 機能、構造、注釈を含む包括的なタンパク質情報を取得します。
- 遺伝子ベースの検索: 遺伝子名またはシンボルでタンパク質を検索
- 配列検索: FASTAまたはJSON形式でアミノ酸配列を取得します
- 特徴解析: 機能ドメイン、活性部位、結合部位、その他のタンパク質の特徴にアクセスします
比較・進化分析(4つのツール)
- タンパク質比較:配列と特徴の解析による複数のタンパク質の並列比較
- 相同遺伝子探索:異なる種間で相同なタンパク質を見つける
- オーソログ同定:進化研究のためのオーソログタンパク質を同定する
- 系統解析:進化関係と系統データを取得する
構造と機能解析(4つのツール)
- 3D構造情報: PDB参照と構造データにアクセス
- 高度なドメイン分析: InterPro、Pfam、SMART アノテーションによる強化されたドメイン分析
- 変異解析:疾患関連変異および突然変異
- 配列構成:アミノ酸組成、疎水性、その他の配列特性
生物学的コンテキスト分析(4つのツール)
- パスウェイ統合:KEGGとReactomeからの関連する生物学的パスウェイ
- タンパク質相互作用:タンパク質間相互作用ネットワーク
- 機能分類: GO用語または機能注釈による検索
- 細胞内局在:細胞内局在からタンパク質を見つける
バッチ処理と高度な検索(3つのツール)
- バッチ処理:複数のタンパク質を効率的に処理
- 高度な検索: 複数のフィルター (長さ、質量、生物、機能) を使用した複雑なクエリ
- 分類:詳細な分類で検索
文献と相互参照(3つのツール)
- 外部データベースリンク: PDB、EMBL、RefSeq、Ensembl、その他のデータベースへのリンク
- 文献参照:関連出版物および引用文献
- アノテーション品質: さまざまなアノテーションの品質スコアと信頼度レベル
データエクスポートとユーティリティ(3つのツール)
- 特殊なエクスポート: GFF、GenBank、EMBL、XML形式でデータをエクスポート
- アクセッション番号の検証: UniProtアクセッション番号の有効性を確認する
- 分類情報: 詳細な分類と系統データ
リソーステンプレート
- URIテンプレートを介してタンパク質データに直接アクセスし、シームレスな統合を実現
インストール
前提条件
- Node.js (v16 以上)
- npmまたはyarn
設定
- リポジトリをクローンします。
- 依存関係をインストールします:
- プロジェクトをビルドします。
ドッカー
Dockerイメージの構築
Docker イメージをビルドします。
Dockerで実行する
コンテナを実行します。
MCP クライアント統合の場合、コンテナーを直接使用できます。
Docker Compose(オプション)
管理を容易にするためにdocker-compose.yml
を作成します。
実行:
使用法
MCPサーバーとして
サーバーは、stdio 経由で通信する MCP サーバーとして実行されるように設計されています。
MCPクライアント構成への追加
サーバーを MCP クライアント構成に追加します (例: Claude Desktop)。
利用可能なツール
1. 検索タンパク質
UniProt データベースで、名前、キーワード、または生物別にタンパク質を検索します。
パラメータ:
query
(必須): 検索クエリ(タンパク質名、キーワード、または複合検索)organism
(オプション):結果をフィルタリングするための生物名または分類IDsize
(オプション): 返される結果の数 (1-500、デフォルト: 25)format
(オプション):出力形式 - json、tsv、fasta、xml(デフォルト:json)
例:
2. get_protein_info
UniProt アクセスにより特定のタンパク質の詳細情報を取得します。
パラメータ:
accession
(必須): UniProtアクセッション番号(例:P04637)format
(オプション):出力形式 - json、tsv、fasta、xml(デフォルト:json)
例:
3. 遺伝子による検索
遺伝子名またはシンボルでタンパク質を検索します。
パラメータ:
gene
(必須): 遺伝子名またはシンボル(例:BRCA1、INS)organism
(オプション):結果をフィルタリングするための生物名または分類IDsize
(オプション): 返される結果の数 (1-500、デフォルト: 25)
例:
4. get_protein_sequence
タンパク質のアミノ酸配列を取得します。
パラメータ:
accession
(必須): UniProtアクセッション番号format
(オプション): 出力形式 - fasta、json(デフォルト: fasta)
例:
5. get_protein_features
タンパク質の機能特性とドメインを取得します。
パラメータ:
accession
(必須): UniProtアクセッション番号
例:
リソーステンプレート
サーバーは、URI テンプレートを通じて UniProt データへの直接アクセスを提供します。
1. タンパク質情報
- URI :
uniprot://protein/{accession}
- 説明: UniProt アクセッション番号の完全なタンパク質情報
- 例:
uniprot://protein/P01308
2. タンパク質配列
- URI :
uniprot://sequence/{accession}
- 説明: FASTA形式のタンパク質配列
- 例:
uniprot://sequence/P01308
3. 検索結果
- URI :
uniprot://search/{query}
- 説明: クエリに一致するタンパク質の検索結果
- 例:
uniprot://search/insulin
例
基本的なタンパク質検索
ヒトのインスリンタンパク質を検索:
詳細なタンパク質情報を入手
ヒトインスリンに関する包括的な情報を取得します。
遺伝子ベースの検索
BRCA1 遺伝子に関連するタンパク質を見つけます。
タンパク質配列の取得
ヒトインスリンのアミノ酸配列を取得します。
タンパク質の特徴を分析する
ヒトインスリンの機能ドメインと特徴を取得します。
API統合
このサーバーは、UniProt REST APIと統合されており、プログラムからタンパク質データにアクセスできます。UniProtの詳細については、以下をご覧ください。
- UniProtウェブサイト: https://www.uniprot.org/
- APIドキュメント: https://www.uniprot.org/help/api
- REST API ガイド: https://www.uniprot.org/help/api\_queries
すべての API リクエストには以下が含まれます。
- ユーザーエージェント:
UniProt-MCP-Server/1.0.0
- タイムアウト:30秒
- ベース URL :
https://rest.uniprot.org
(プログラムによるアクセスのみ)
エラー処理
サーバーには包括的なエラー処理が含まれています。
- 入力検証: すべてのパラメータは型ガードを使用して検証されます
- APIエラー: ネットワークおよびAPIエラーがキャッチされ、説明メッセージとともに返されます
- タイムアウト処理: 30秒後にリクエストがタイムアウトします
- グレースフルデグラデーション: 部分的な障害は適切に処理されます
発達
プロジェクトを構築する
開発モード
TypeScript コンパイラをウォッチモードで実行します。
プロジェクト構造
依存関係
- @modelcontextprotocol/sdk : サーバー実装用のコア MCP SDK
- axios : UniProt APIリクエスト用のHTTPクライアント
- typescript : 開発用の TypeScript コンパイラ
ライセンス
MITライセンス
貢献
- リポジトリをフォークする
- 機能ブランチを作成する
- 変更を加える
- 該当する場合はテストを追加する
- プルリクエストを送信する
サポート
問題や質問については:
- UniProt APIドキュメントを確認する
- モデルコンテキストプロトコル仕様を確認する
- リポジトリで問題を開く
拡張自然について
この包括的なUniProt MCPサーバーは、AIを活用したバイオインフォマティクスおよび計算生物学ソリューションのリーディングイノベーターである**Augmented Nature**によって開発されました。Augmented Natureは、人工知能と生物学研究のギャップを埋める高度なツールの開発を専門としており、研究者が生物学データからより深い洞察を引き出すことを可能にします。
完全なツールリファレンス
コアタンパク質分析ツール
search_proteins
- 名前、キーワード、または生物名でUniProtデータベースを検索しますget_protein_info
- アクセッション番号で詳細なタンパク質情報を取得するsearch_by_gene
- 遺伝子名またはシンボルでタンパク質を検索get_protein_sequence
- アミノ酸配列を取得するget_protein_features
- 機能的特徴とドメインにアクセスする
比較・進化分析ツール
compare_proteins
- 複数のタンパク質を並べて比較するget_protein_homologs
- 種を超えて相同なタンパク質を見つけるget_protein_orthologs
- 相同タンパク質を特定するget_phylogenetic_info
- 進化関係を取得する
構造と機能解析ツール
get_protein_structure
- PDBから3D構造情報にアクセスするget_protein_domains_detailed
- 強化されたドメイン解析 (InterPro、Pfam、SMART)get_protein_variants
- 疾患関連変異および突然変異analyze_sequence_composition
- アミノ酸組成分析
生物学的コンテキストツール
get_protein_pathways
- 関連する生物学的経路 (KEGG、Reactome)get_protein_interactions
- タンパク質間相互作用ネットワークsearch_by_function
- GO用語または機能注釈による検索search_by_localization
- 細胞内局在でタンパク質を検索する
バッチ処理と高度な検索ツール
batch_protein_lookup
- 複数のアクセスを効率的に処理するadvanced_search
- 複数のフィルターを使用した複雑なクエリsearch_by_taxonomy
- 分類による検索
文献と相互参照ツール
get_external_references
- 他のデータベースへのリンク (PDB、EMBL、RefSeq など)get_literature_references
- 関連する出版物と引用get_annotation_confidence
- アノテーションの品質スコア
データエクスポートとユーティリティツール
export_protein_data
- 特殊な形式(GFF、GenBank、EMBL、XML)でエクスポートvalidate_accession
- アクセス番号の有効性を確認するget_taxonomy_info
- 詳細な分類情報
変更履歴
v1.0.0 - 包括的なバイオインフォマティクスプラットフォーム
- 主な拡張:新しい特殊ツール21個を追加(合計:26個)
- 比較分析:タンパク質の比較、相同遺伝子/相同遺伝子の同定、系統解析
- 構造生物学:3D構造統合、詳細ドメイン解析、変異解析
- システム生物学:経路統合、タンパク質相互作用、機能分類
- 高度な検索: バッチ処理、複雑なフィルタリング、分類検索
- 文献統合:外部データベースリンク、引用、注釈の信頼性
- データエクスポート: 複数の特殊形式 (GFF、GenBank、EMBL、XML)
- 強化された Docker サポート: セキュリティのベストプラクティスに基づいたマルチステージビルド
- 包括的なドキュメント: 完全なツールリファレンスと例
- Augmented Natureによって開発:プロフェッショナルバイオインフォマティクスプラットフォーム
Related MCP Servers
- Python
- Python
- PythonMIT License
- TypeScriptMIT License