LionScraper
LionScraper (雄狮采集器) MCP + CLI сервис
Что это такое?
LionScraper (雄狮采集器) — это расширение для браузера, которое позволяет собирать списки, статьи, ссылки, изображения и другие данные с веб-страниц. В этом репозитории представлен сопутствующий MCP-сервис: подключив его к используемому вами AI-приложению (например, Cursor), вы сможете просить ИИ вызывать расширение для выполнения сбора данных прямо в чате, не кликая по каждому пункту меню вручную.
Его можно представить как «мостик»: ИИ-приложение находится с одной стороны, расширение браузера — с другой, а данный сервис отвечает за передачу команд между ними. Логика сбора данных выполняется внутри расширения, а данный сервис обеспечивает лишь соединение и пересылку.
Подготовка перед использованием
Браузер: Chrome или Edge (в зависимости от того, что поддерживает расширение).
Расширение LionScraper: Установите и активируйте его из магазина расширений браузера (название уточняйте в магазине).
Node.js: На компьютере должна быть установлена версия 18 или выше. Если она еще не установлена, скачайте инсталлятор с официального сайта Node.js и следуйте инструкциям.
AI-приложение с поддержкой MCP: Например, Cursor, Trae и другие (проверьте поддержку MCP в настройках вашего ПО).
Установка MCP-сервиса (пакет npm)
Сервис опубликован в npm под именем lionscraper. Вы можете перейти по ссылке, чтобы ознакомиться с описанием и версиями.
Откройте терминал на компьютере (в Windows это может быть «Командная строка» или PowerShell) и выполните:
npm install -g lionscraperПосле успешной установки в системе появятся две команды: lionscraper-mcp (для подключения MCP к ИИ-приложениям) и lionscraper (терминальный CLI). Обе они зависят от одного и того же локального демона и моста расширения, поэтому PORT (по умолчанию 13808) должен совпадать с портом моста в настройках расширения.
Если вы не хотите выполнять глобальную установку, можно временно загрузить и запустить сервис через npx в настройках MCP вашего ИИ-приложения (при условии, что Node.js установлен). Пример логики: установите команду запуска как npx, а аргументы — -y, -p, lionscraper, lionscraper-mcp (конкретный формат JSON см. в документации к вашему ПО).
CLI (Терминал)
При условии глобальной установки вы можете использовать lionscraper в терминале для скриптового сбора данных или параллельно с MCP (используя общие lionscraper daemon и PORT):
lionscraper daemon: фоновый процесс, предоставляющий HTTP (для CLI / легких MCP-вызовов) и WebSocket (для подключения расширения).lionscraper stop: остановка демона на текущем порту.lionscraper ping: проверка, зарегистрировано ли расширение в мосту (без участия MCP-диалога).lionscraper scrape: запуск сбора данных; можно использовать--methodдля выбора режима (список/текст/email/телефон/ссылка/изображение), что соответствует возможностям инструментов MCP.
Пример:
lionscraper daemon
lionscraper ping
lionscraper scrape -u https://www.example.comБолее подробное описание параметров, работы с несколькими URL, пагинацией и фильтрацией см. в packages/node/README_cn.md; английская версия соответствует странице на npm: пакет lionscraper на npm.
Добавление MCP в ИИ-приложение
Примеры ниже предполагают глобальную установку (интерфейс ПО может отличаться). В MCP все значения env должны быть строками.
Простая конфигурация (если env не указан, PORT по умолчанию 13808, должен совпадать с портом моста расширения):
{
"mcpServers": {
"lionscraper": {
"command": "lionscraper-mcp"
}
}
}Подробная конфигурация (ключи можно удалять по необходимости; пустая строка эквивалентна пропуску ключа):
{
"mcpServers": {
"lionscraper": {
"command": "lionscraper-mcp",
"env": {
"PORT": "13808",
"TIMEOUT": "120000",
"LANG": "zh-CN",
"TOKEN": "",
"DAEMON": ""
}
}
}
}PORT: порт для HTTP + WebSocket, по умолчанию 13808, должен совпадать с портом моста в расширении.TIMEOUT: время ожидания (в мс) завершения предыдущего экземпляра при захвате порта, по умолчанию 120000;0означает принудительный захват.LANG: язык описания инструментов и логов stderr (например,zh-CN,en-US).TOKEN: Bearer-токен, соответствующий демону; оставьте пустым, если аутентификация не требуется.DAEMON: только0запрещает легкому MCP автоматически запускать демона; пустое значение или другие значения эквивалентны пропуску.
После сохранения конфигурации перезапустите MCP или само приложение согласно требованиям вашего ПО, чтобы настройки вступили в силу.
Синхронизация порта в расширении браузера
Откройте настройки или страницу параметров LionScraper.
Найдите порт моста (или аналогичное название) и установите его равным значению
PORTиз конфигурации MCP (например,13808).Если вы меняли порт или возникли проблемы с соединением, используйте кнопку «Переподключиться» в расширении; если это не помогло, попробуйте перезагрузить расширение или перезапустить браузер.
Как пользоваться ежедневно?
Убедитесь, что расширение активировано, и страница, с которой нужно собрать данные, открыта в браузере (или следуйте инструкциям расширения).
В чате с ИИ опишите задачу на естественном языке, например:
«Проверь, подключено ли расширение LionScraper.»
«Помоги мне собрать данные списка / текст статьи / email / телефон / ссылки / изображения с этой страницы.»
ИИ вызовет расширение через MCP; если возникнет ошибка подключения или тайм-аут, попросите ИИ выполнить проверку соединения еще раз и убедитесь, что порты совпадают, а расширение включено.
Часто задаваемые вопросы
В: Появляется ошибка, что расширение не подключено или сбор данных не удался?
Включено ли расширение и не заблокировано ли оно?
Порт, настроенный в ИИ, и порт моста в расширении полностью совпадают?
На одном компьютере обычно достаточно одного моста между сервисом и расширением; если вы одновременно используете несколько конфигураций MCP или установили сервис несколько раз, это может вызвать конфликты.
В: В ИИ уже видны «инструменты», значит ли это, что все подключено?
Не обязательно. Наличие инструментов означает лишь то, что связь между ИИ и данным сервисом установлена; расширение также должно подключиться к тому же порту и завершить регистрацию.
MCP Registry и сторонние каталоги
Этот репозиторий зарегистрирован в официальном MCP Registry как два пакета (имена файлов метаданных — server.json):
Каталог | Имя в Registry | Описание |
| Соответствует npm-пакету | |
| Соответствует PyPI-пакету |
Краткие шаги по публикации в Registry (требуется установленный официальный CLI, см. Quickstart):
Опубликуйте npm / PyPI версию, соответствующую
versionвserver.json(в текущем примере — 1.0.3).В корне репозитория перейдите в
packages/node, выполнитеmcp-publisher login github(один раз), затемmcp-publisher publish.Перейдите в
packages/pythonи выполнитеmcp-publisher publish(можно использовать тот же логин).
У сторонних каталогов нет единой точки входа. Обычно это делается так: на Glama используйте Add Server согласно процедуре сайта; Smithery в основном ориентирован на публичный HTTPS + Streamable HTTP, что отличается от формата данного репозитория (основной упор на stdio + установка через npm/pip), поэтому перед использованием сторонних сервисов может потребоваться подготовка хостинга.
Лицензия
MIT (соответствует заявленной в npm-пакете lionscraper).
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/dowant/lionscraper-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server