Skip to main content
Glama

Paper Pilot

Paper Pilot

El copiloto de investigación de tu IA.

Tu IA busca en Google cuando dices "investiga". Paper Pilot busca realmente en bases de datos académicas reales, descarga los PDFs, los lee de principio a fin y te proporciona evidencia con citas.

CI PyPI License: MIT Python 3.11+ GitHub stars


Demo

Inicio rápido

uvx paper-pilot

Eso es todo. O instálalo:

pip install paper-pilot

Cómo funciona

graph LR
    A[Prompt] --> B[Search 6 databases]
    B --> C[Resolve OA PDFs]
    C --> D[Download & read]
    D --> E[Extract evidence]
    E --> F[Render figures]
    F --> G[Markdown report]
    G --> H[Zotero sync]

Un prompt. Seis bases de datos académicas. PDFs reales. Citas reales.

Research retrieval-augmented generation, deep-read the top papers, and compare the methods.

Tu IA hará lo siguiente:

  1. Buscará en Semantic Scholar, OpenAlex, arXiv, Crossref y Europe PMC

  2. Encontrará los PDFs de acceso abierto, no solo los resúmenes

  3. Los descargará y leerá de principio a fin

  4. Extraerá fragmentos de evidencia con atribución de fuente

  5. Renderizará páginas específicas para que pueda ver las figuras y tablas

  6. Escribirá un informe estructurado en Markdown

  7. Guardará todo en tu biblioteca de Zotero


vs. alternativas

ChatGPT Deep Research

Gemini Deep Research

Perplexity Pro

Paper Pilot

Lee PDFs reales

Resúmenes web

Resúmenes web

Resúmenes web

Extracción de texto completo

Figuras y tablas

Solo texto

Solo texto

Solo texto

Renderizado de página a PNG

Tu biblioteca

Bloqueada en su UI

Bloqueada en Google

Bloqueada en Perplexity

Sincroniza con Zotero

Fuentes

Búsqueda web genérica

Búsqueda web genérica

Búsqueda web

6 bases de datos académicas

Coste

$200/mes

$20/mes

$20/mes

Gratis, licencia MIT

Tus datos

Su nube

Su nube

Su nube

Tu máquina

Código abierto

No

No

No


Configuración del cliente MCP

Claude Desktop

Añade a tu claude_desktop_config.json:

{
  "mcpServers": {
    "paper-pilot": {
      "command": "uv",
      "args": ["--directory", "/path/to/paper-pilot", "run", "paper-pilot"],
      "env": {
        "OPENALEX_EMAIL": "you@example.com",
        "UNPAYWALL_EMAIL": "you@example.com",
        "ZOTERO_LOCAL": "true",
        "SCIHUB_ENABLED": "false"
      }
    }
  }
}

Claude Code

claude mcp add --scope user paper-pilot -- uv --directory /path/to/paper-pilot run paper-pilot

Codex

Añade a ~/.codex/config.toml:

[mcp_servers.paper_pilot]
command = "uv"
args = ["--directory", "/path/to/paper-pilot", "run", "paper-pilot"]

[mcp_servers.paper_pilot.env]
OPENALEX_EMAIL = "you@example.com"
ZOTERO_LOCAL = "true"

Modo HTTP transmitible

paper-pilot --transport streamable-http --host 127.0.0.1 --port 8000

Herramientas

Herramienta

Qué hace

research_topic

Pipeline completo: búsqueda, descarga, informe, sincronización con Zotero

deep_read_topic

Todo lo anterior + extracción de texto completo con fragmentos de evidencia

render_pdf_pages

Páginas de PDF a PNG para inspección de figuras y tablas

search_literature

Búsqueda académica multifuente de grano fino

find_similar_papers

Expansión de trabajos relacionados a partir de un paper semilla

inspect_open_access_pdf

Verificación de disponibilidad OA y vista previa de PDF

extract_local_pdf_text

Extracción de texto de cualquier PDF local

search_scihub

Búsqueda en Sci-Hub por DOI, título o palabra clave (opcional)

download_scihub_paper

Descarga un paper vía Sci-Hub por DOI (opcional)

search_libgen

Búsqueda suplementaria en biblioteca sombra

healthcheck

Verifica que todas las conexiones estén activas


Integración con Sci-Hub (opcional)

El acceso a Sci-Hub está desactivado por defecto. Para activarlo:

SCIHUB_ENABLED=true

Una vez activado, usa search_scihub y download_scihub_paper directamente, o pasa include_scihub=True a research_topic / deep_read_topic para una alternativa automática.

Aviso legal: La integración con Sci-Hub se proporciona estrictamente para fines educativos y de investigación. Los usuarios son los únicos responsables del cumplimiento de las leyes aplicables y las políticas institucionales.


Quién lo utiliza

Estudiantes de doctorado que no quieren pasar una semana en una revisión bibliográfica. Apúntalo a tu tema de tesis y obtén una comparación estructurada con citas reales y los PDFs ya en Zotero.

Laboratorios de investigación que quieren escanear preprints semanalmente y archivarlos automáticamente. Ejecuta research_topic de forma programada y mantén tu biblioteca de grupo actualizada.

Desarrolladores de IA que necesitan que sus agentes trabajen con papers académicos reales en lugar de fragmentos de web scraping.


Configuración

OPENALEX_EMAIL=you@example.com        # Required for polite API access
UNPAYWALL_EMAIL=you@example.com       # Required for OA resolution
SEMANTIC_SCHOLAR_API_KEY=             # Optional, higher rate limits

# Local Zotero
ZOTERO_LOCAL=true
ZOTERO_LIBRARY_TYPE=user

# Web Zotero API (alternative)
ZOTERO_LIBRARY_ID=
ZOTERO_API_KEY=

# Sci-Hub (disabled by default)
SCIHUB_ENABLED=false

# Storage
PAPER_PILOT_DATA_DIR=./data

# Institutional networks
HTTP_PROXY=
HTTPS_PROXY=
SSL_CERT_FILE=

Estructura del proyecto

src/paper_pilot/
  server.py              MCP tools and pipeline orchestration
  config.py              Environment and settings
  services/
    academic.py          Multi-source scholarly search
    open_access.py       OA resolution and PDF downloads
    scihub.py            Sci-Hub paper resolution (opt-in)
    deep_read.py         Full-text extraction and page rendering
    zotero.py            Local and web Zotero integration
    reporting.py         Markdown report generation
    libgen.py            Supplementary LibGen support

Detalles de la arquitectura: docs/ARCHITECTURE.md


Para agentes de IA


Contribuciones

PRs bienvenidas. Las áreas de mayor impacto:

  • Nuevos adaptadores de fuentes académicas

  • Mejor lógica de resolución de OA

  • Mejoras en el análisis de PDF

  • Más configuraciones de clientes MCP

Consulta CONTRIBUTING.md.


Esta herramienta está diseñada solo para fines de investigación académica y educativos. Las funciones de acceso abierto utilizan solo fuentes legales y disponibles públicamente. Las integraciones con Sci-Hub y LibGen están desactivadas por defecto y se proporcionan como funciones opcionales.


Licencia

MIT. Haz lo que quieras con ella.

Si esto ayuda a tu investigación, dale una estrella al repositorio y cuéntaselo a un colega.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/aytzey/paper-pilot'

If you have feedback or need assistance with the MCP directory API, please join our Discord server