Paper Pilot
Paper Pilot
El copiloto de investigación de tu IA.
Tu IA busca en Google cuando dices "investiga". Paper Pilot busca realmente en bases de datos académicas reales, descarga los PDFs, los lee de principio a fin y te proporciona evidencia con citas.

Inicio rápido
uvx paper-pilotEso es todo. O instálalo:
pip install paper-pilotCómo funciona
graph LR
A[Prompt] --> B[Search 6 databases]
B --> C[Resolve OA PDFs]
C --> D[Download & read]
D --> E[Extract evidence]
E --> F[Render figures]
F --> G[Markdown report]
G --> H[Zotero sync]Un prompt. Seis bases de datos académicas. PDFs reales. Citas reales.
Research retrieval-augmented generation, deep-read the top papers, and compare the methods.Tu IA hará lo siguiente:
Buscará en Semantic Scholar, OpenAlex, arXiv, Crossref y Europe PMC
Encontrará los PDFs de acceso abierto, no solo los resúmenes
Los descargará y leerá de principio a fin
Extraerá fragmentos de evidencia con atribución de fuente
Renderizará páginas específicas para que pueda ver las figuras y tablas
Escribirá un informe estructurado en Markdown
Guardará todo en tu biblioteca de Zotero
vs. alternativas
ChatGPT Deep Research | Gemini Deep Research | Perplexity Pro | Paper Pilot | |
Lee PDFs reales | Resúmenes web | Resúmenes web | Resúmenes web | Extracción de texto completo |
Figuras y tablas | Solo texto | Solo texto | Solo texto | Renderizado de página a PNG |
Tu biblioteca | Bloqueada en su UI | Bloqueada en Google | Bloqueada en Perplexity | Sincroniza con Zotero |
Fuentes | Búsqueda web genérica | Búsqueda web genérica | Búsqueda web | 6 bases de datos académicas |
Coste | $200/mes | $20/mes | $20/mes | Gratis, licencia MIT |
Tus datos | Su nube | Su nube | Su nube | Tu máquina |
Código abierto | No | No | No | Sí |
Configuración del cliente MCP
Claude Desktop
Añade a tu claude_desktop_config.json:
{
"mcpServers": {
"paper-pilot": {
"command": "uv",
"args": ["--directory", "/path/to/paper-pilot", "run", "paper-pilot"],
"env": {
"OPENALEX_EMAIL": "you@example.com",
"UNPAYWALL_EMAIL": "you@example.com",
"ZOTERO_LOCAL": "true",
"SCIHUB_ENABLED": "false"
}
}
}
}Claude Code
claude mcp add --scope user paper-pilot -- uv --directory /path/to/paper-pilot run paper-pilotCodex
Añade a ~/.codex/config.toml:
[mcp_servers.paper_pilot]
command = "uv"
args = ["--directory", "/path/to/paper-pilot", "run", "paper-pilot"]
[mcp_servers.paper_pilot.env]
OPENALEX_EMAIL = "you@example.com"
ZOTERO_LOCAL = "true"Modo HTTP transmitible
paper-pilot --transport streamable-http --host 127.0.0.1 --port 8000Herramientas
Herramienta | Qué hace |
| Pipeline completo: búsqueda, descarga, informe, sincronización con Zotero |
| Todo lo anterior + extracción de texto completo con fragmentos de evidencia |
| Páginas de PDF a PNG para inspección de figuras y tablas |
| Búsqueda académica multifuente de grano fino |
| Expansión de trabajos relacionados a partir de un paper semilla |
| Verificación de disponibilidad OA y vista previa de PDF |
| Extracción de texto de cualquier PDF local |
| Búsqueda en Sci-Hub por DOI, título o palabra clave (opcional) |
| Descarga un paper vía Sci-Hub por DOI (opcional) |
| Búsqueda suplementaria en biblioteca sombra |
| Verifica que todas las conexiones estén activas |
Integración con Sci-Hub (opcional)
El acceso a Sci-Hub está desactivado por defecto. Para activarlo:
SCIHUB_ENABLED=trueUna vez activado, usa search_scihub y download_scihub_paper directamente, o pasa include_scihub=True a research_topic / deep_read_topic para una alternativa automática.
Aviso legal: La integración con Sci-Hub se proporciona estrictamente para fines educativos y de investigación. Los usuarios son los únicos responsables del cumplimiento de las leyes aplicables y las políticas institucionales.
Quién lo utiliza
Estudiantes de doctorado que no quieren pasar una semana en una revisión bibliográfica. Apúntalo a tu tema de tesis y obtén una comparación estructurada con citas reales y los PDFs ya en Zotero.
Laboratorios de investigación que quieren escanear preprints semanalmente y archivarlos automáticamente. Ejecuta research_topic de forma programada y mantén tu biblioteca de grupo actualizada.
Desarrolladores de IA que necesitan que sus agentes trabajen con papers académicos reales en lugar de fragmentos de web scraping.
Configuración
OPENALEX_EMAIL=you@example.com # Required for polite API access
UNPAYWALL_EMAIL=you@example.com # Required for OA resolution
SEMANTIC_SCHOLAR_API_KEY= # Optional, higher rate limits
# Local Zotero
ZOTERO_LOCAL=true
ZOTERO_LIBRARY_TYPE=user
# Web Zotero API (alternative)
ZOTERO_LIBRARY_ID=
ZOTERO_API_KEY=
# Sci-Hub (disabled by default)
SCIHUB_ENABLED=false
# Storage
PAPER_PILOT_DATA_DIR=./data
# Institutional networks
HTTP_PROXY=
HTTPS_PROXY=
SSL_CERT_FILE=Estructura del proyecto
src/paper_pilot/
server.py MCP tools and pipeline orchestration
config.py Environment and settings
services/
academic.py Multi-source scholarly search
open_access.py OA resolution and PDF downloads
scihub.py Sci-Hub paper resolution (opt-in)
deep_read.py Full-text extraction and page rendering
zotero.py Local and web Zotero integration
reporting.py Markdown report generation
libgen.py Supplementary LibGen supportDetalles de la arquitectura: docs/ARCHITECTURE.md
Para agentes de IA
AGENTS.md -- guía operativa compartida
CLAUDE.md -- configuración de Claude Desktop y Claude Code
CODEX.md -- configuración de Codex
docs/CLIENTS.md -- comparación de clientes lado a lado
Contribuciones
PRs bienvenidas. Las áreas de mayor impacto:
Nuevos adaptadores de fuentes académicas
Mejor lógica de resolución de OA
Mejoras en el análisis de PDF
Más configuraciones de clientes MCP
Consulta CONTRIBUTING.md.
Aviso legal
Esta herramienta está diseñada solo para fines de investigación académica y educativos. Las funciones de acceso abierto utilizan solo fuentes legales y disponibles públicamente. Las integraciones con Sci-Hub y LibGen están desactivadas por defecto y se proporcionan como funciones opcionales.
Licencia
MIT. Haz lo que quieras con ella.
Si esto ayuda a tu investigación, dale una estrella al repositorio y cuéntaselo a un colega.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/aytzey/paper-pilot'
If you have feedback or need assistance with the MCP directory API, please join our Discord server