pageindex-mcp
Uses OpenAI API to generate document trees during indexing of PDF documents, enabling vectorless RAG.
Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@pageindex-mcpIndex the PDF ./report.pdf with id annual-report"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
pageindex-mcp
Self-hosted MCP server для Claude Code, реализующий PageIndex vectorless RAG полностью локально.
Архитектура
Claude Code (Max plan — handles all reasoning)
│ stdio
▼
pageindex-mcp (TypeScript)
├── index_document ──→ run_pageindex.py (Python, local)
│ └── OpenAI API (tree generation, one-time)
├── get_document_tree ──→ local JSON
├── get_page_content ──→ pdftotext (local)
├── list_documents ──→ local filesystem
└── delete_document ──→ local filesystemНикаких LLM-вызовов внутри сервера — Claude Code сам навигирует дерево и анализирует контент. Не нужен ANTHROPIC_API_KEY.
Related MCP server: pageindex-local-mcp
Предварительные требования
# 1. Node.js ≥ 18
node --version
# 2. Python PageIndex repo
git clone https://github.com/VectifyAI/PageIndex /opt/pageindex
cd /opt/pageindex && pip install -r requirements.txt
# 3. poppler-utils для извлечения текста из PDF
# Ubuntu/Debian:
sudo apt install poppler-utils
# macOS:
brew install popplerУстановка и сборка
npm install
npm run buildПеременные окружения
Переменная | Обязательна | Описание |
| да (для индексации) | PageIndex генерирует дерево через OpenAI |
| да | Путь к клонированному репозиторию PageIndex |
| нет | Где хранить JSON индексы (default: |
| нет | OpenAI модель (default: |
Для OpenRouter вместо прямого OpenAI:
OPENAI_BASE_URL=https://openrouter.ai/api/v1
OPENAI_API_KEY=sk-or-v1-...
PAGEINDEX_MODEL=openai/gpt-4oПодключение к Claude Code
Вариант A: локальный stdio (рекомендуется)
Добавить в ~/.claude.json или .mcp.json в проекте:
{
"mcpServers": {
"pageindex-local": {
"command": "node",
"args": ["/absolute/path/to/pageindex-mcp/build/index.js"],
"env": {
"OPENAI_API_KEY": "sk-...",
"PAGEINDEX_REPO_PATH": "/opt/pageindex"
}
}
}
}Вариант B: dev-режим (tsx, без сборки)
{
"mcpServers": {
"pageindex-local": {
"command": "npx",
"args": ["tsx", "/absolute/path/to/pageindex-mcp/src/index.ts"],
"env": {
"OPENAI_API_KEY": "sk-...",
"PAGEINDEX_REPO_PATH": "/opt/pageindex"
}
}
}
}Использование в Claude Code
# 1. Индексировать документ (один раз)
"Проиндексируй PDF /path/to/spec.pdf с id pam-spec"
# 2. Посмотреть структуру документа
"Покажи структуру документа pam-spec"
# 3. Извлечь контент конкретной секции
"Покажи содержимое ноды 0005 в документе pam-spec"
# 4. Список всех документов
"Какие документы проиндексированы?"
# 5. Удалить индекс
"Удали индекс pam-spec"Claude Code сам навигирует дерево, выбирает нужные секции и отвечает — не нужны отдельные API-вызовы.
Инструменты MCP
Инструмент | Описание |
| Генерирует PageIndex tree из PDF (один раз, затем переиспользуется) |
| Иерархическая структура документа для навигации |
| Извлечение текста по node_id или диапазону страниц |
| Список проиндексированных документов с метаданными |
| Удалить документ из индекса |
Стоимость
Индексация (разово): ~$0.10–0.50 за документ (OpenAI gpt-4o)
Поиск: бесплатно на Claude Code Max plan
Хранение: локальные JSON файлы
Ограничения
Генерация дерева требует OpenAI API (hardcoded в Python PageIndex)
Для больших PDF (500+ стр.) индексация может занять несколько минут
Без
poppler-utilsтекст страниц не извлекается (только метаданные дерева)
This server cannot be installed
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/ypolosov/pageindex-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server