Skip to main content
Glama

Paper Pilot

Paper Pilot

AIのためのリサーチコパイロット。

あなたが「リサーチ」と言うとき、AIはGoogle検索をするだけかもしれません。Paper Pilotは、実際の学術データベースを検索し、PDFをダウンロードして隅々まで読み込み、引用付きのエビデンスを提供します。

CI PyPI License: MIT Python 3.11+ GitHub stars


Demo

クイックスタート

uvx paper-pilot

以上です。または、以下のようにインストールしてください:

pip install paper-pilot

仕組み

graph LR
    A[Prompt] --> B[Search 6 databases]
    B --> C[Resolve OA PDFs]
    C --> D[Download & read]
    D --> E[Extract evidence]
    E --> F[Render figures]
    F --> G[Markdown report]
    G --> H[Zotero sync]

1つのプロンプト。6つの学術データベース。本物のPDF。本物の引用。

Research retrieval-augmented generation, deep-read the top papers, and compare the methods.

AIは以下のことを行います:

  1. Semantic ScholarOpenAlexarXivCrossrefEurope PMCを検索

  2. アブストラクトだけでなく、オープンアクセスのPDFを見つける

  3. PDFをダウンロードして隅々まで読み込む

  4. ソースを明記したエビデンスのチャンクを抽出する

  5. 特定のページをレンダリングして、図表を視覚的に確認できるようにする

  6. 構造化されたMarkdownレポートを作成する

  7. すべてをZoteroライブラリに保存する


代替ツールとの比較

ChatGPT Deep Research

Gemini Deep Research

Perplexity Pro

Paper Pilot

実際のPDFを読み込む

Web要約のみ

Web要約のみ

Web要約のみ

全文抽出

図表の扱い

テキストのみ

テキストのみ

テキストのみ

PNGへのページレンダリング

ライブラリ管理

UI内に固定

Google内に固定

Perplexity内に固定

Zoteroと同期

ソース

一般的なWeb検索

一般的なWeb検索

Web検索

6つの学術データベース

コスト

月額200ドル

月額20ドル

月額20ドル

無料、MITライセンス

データ管理

クラウド上

クラウド上

クラウド上

ローカル環境

オープンソース

いいえ

いいえ

いいえ

はい


MCPクライアントの設定

Claude Desktop

claude_desktop_config.json に以下を追加してください:

{
  "mcpServers": {
    "paper-pilot": {
      "command": "uv",
      "args": ["--directory", "/path/to/paper-pilot", "run", "paper-pilot"],
      "env": {
        "OPENALEX_EMAIL": "you@example.com",
        "UNPAYWALL_EMAIL": "you@example.com",
        "ZOTERO_LOCAL": "true",
        "SCIHUB_ENABLED": "false"
      }
    }
  }
}

Claude Code

claude mcp add --scope user paper-pilot -- uv --directory /path/to/paper-pilot run paper-pilot

Codex

~/.codex/config.toml に以下を追加してください:

[mcp_servers.paper_pilot]
command = "uv"
args = ["--directory", "/path/to/paper-pilot", "run", "paper-pilot"]

[mcp_servers.paper_pilot.env]
OPENALEX_EMAIL = "you@example.com"
ZOTERO_LOCAL = "true"

ストリーミング可能なHTTPモード

paper-pilot --transport streamable-http --host 127.0.0.1 --port 8000

ツール

ツール

機能

research_topic

フルパイプライン:検索、ダウンロード、レポート作成、Zotero同期

deep_read_topic

上記すべて + エビデンスチャンク付きの全文抽出

render_pdf_pages

図表確認のためのPDFページからPNGへの変換

search_literature

高精度なマルチソース学術検索

find_similar_papers

シード論文に基づく関連研究の拡張

inspect_open_access_pdf

OAの利用可能性チェックとPDFプレビュー

extract_local_pdf_text

ローカルPDFからのテキスト抽出

search_scihub

DOI、タイトル、キーワードによるSci-Hub検索(オプトイン)

download_scihub_paper

DOIによるSci-Hub経由の論文ダウンロード(オプトイン)

search_libgen

補完的なシャドウライブラリ検索

healthcheck

すべての接続状態の確認


Sci-Hub統合(オプトイン)

Sci-Hubへのアクセスはデフォルトで無効になっています。有効にするには:

SCIHUB_ENABLED=true

有効化後は、search_scihubdownload_scihub_paper を直接使用するか、research_topic / deep_read_topicinclude_scihub=True を渡すことで自動フォールバックが可能です。

免責事項: Sci-Hub統合は、教育および研究目的でのみ提供されています。適用される法律および機関のポリシーへの準拠については、ユーザーが単独で責任を負うものとします。


利用対象者

博士課程の学生: 文献レビューに1週間も費やしたくない方。論文のトピックを指定すれば、実際の引用とZoteroに保存済みのPDFを含む構造化された比較レポートが返ってきます。

研究ラボ: 毎週プレプリントをスキャンして自動整理したい方。research_topic をスケジュール実行して、グループライブラリを常に最新の状態に保てます。

AI開発者: Webスクレイピングの断片ではなく、実際の学術論文を扱うエージェントを構築したい方。


設定

OPENALEX_EMAIL=you@example.com        # Required for polite API access
UNPAYWALL_EMAIL=you@example.com       # Required for OA resolution
SEMANTIC_SCHOLAR_API_KEY=             # Optional, higher rate limits

# Local Zotero
ZOTERO_LOCAL=true
ZOTERO_LIBRARY_TYPE=user

# Web Zotero API (alternative)
ZOTERO_LIBRARY_ID=
ZOTERO_API_KEY=

# Sci-Hub (disabled by default)
SCIHUB_ENABLED=false

# Storage
PAPER_PILOT_DATA_DIR=./data

# Institutional networks
HTTP_PROXY=
HTTPS_PROXY=
SSL_CERT_FILE=

プロジェクト構造

src/paper_pilot/
  server.py              MCP tools and pipeline orchestration
  config.py              Environment and settings
  services/
    academic.py          Multi-source scholarly search
    open_access.py       OA resolution and PDF downloads
    scihub.py            Sci-Hub paper resolution (opt-in)
    deep_read.py         Full-text extraction and page rendering
    zotero.py            Local and web Zotero integration
    reporting.py         Markdown report generation
    libgen.py            Supplementary LibGen support

アーキテクチャの詳細: docs/ARCHITECTURE.md


AIエージェント向け


貢献

プルリクエストを歓迎します。特に以下の分野での貢献を期待しています:

  • 新しい学術ソースアダプターの追加

  • OA解決ロジックの改善

  • PDF解析の向上

  • MCPクライアント設定の追加

CONTRIBUTING.md を参照してください。


免責事項

本ツールは学術研究および教育目的でのみ設計されています。オープンアクセス機能は、合法かつ公開されているソースのみを使用します。Sci-HubおよびLibGenの統合はデフォルトで無効であり、オプトイン機能として提供されています。


ライセンス

MIT。自由に使用してください。

もしこのツールが研究の役に立ったなら、リポジトリにスターを付け、同僚に紹介してください。

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/aytzey/paper-pilot'

If you have feedback or need assistance with the MCP directory API, please join our Discord server