Skip to main content
Glama

LionScraper (雄狮采集器) MCP + CLI сервис

Что это такое?

LionScraper (雄狮采集器) — это расширение для браузера, которое позволяет собирать списки, статьи, ссылки, изображения и другие данные с веб-страниц. В этом репозитории представлен сопутствующий MCP-сервис: подключив его к используемому вами AI-приложению (например, Cursor), вы сможете просить ИИ вызывать расширение для выполнения сбора данных прямо в чате, не кликая по каждому пункту меню вручную.

Его можно представить как «мостик»: ИИ-приложение находится с одной стороны, расширение браузера — с другой, а данный сервис отвечает за передачу команд между ними. Логика сбора данных выполняется внутри расширения, а данный сервис обеспечивает лишь соединение и пересылку.

Подготовка перед использованием

  1. Браузер: Chrome или Edge (в зависимости от того, что поддерживает расширение).

  2. Расширение LionScraper: Установите и активируйте его из магазина расширений браузера (название уточняйте в магазине).

  3. Node.js: На компьютере должна быть установлена версия 18 или выше. Если она еще не установлена, скачайте инсталлятор с официального сайта Node.js и следуйте инструкциям.

  4. AI-приложение с поддержкой MCP: Например, Cursor, Trae и другие (проверьте поддержку MCP в настройках вашего ПО).

Установка MCP-сервиса (пакет npm)

Сервис опубликован в npm под именем lionscraper. Вы можете перейти по ссылке, чтобы ознакомиться с описанием и версиями.

Откройте терминал на компьютере (в Windows это может быть «Командная строка» или PowerShell) и выполните:

npm install -g lionscraper

После успешной установки в системе появятся две команды: lionscraper-mcp (для подключения MCP к ИИ-приложениям) и lionscraper (терминальный CLI). Обе они зависят от одного и того же локального демона и моста расширения, поэтому PORT (по умолчанию 13808) должен совпадать с портом моста в настройках расширения.

Если вы не хотите выполнять глобальную установку, можно временно загрузить и запустить сервис через npx в настройках MCP вашего ИИ-приложения (при условии, что Node.js установлен). Пример логики: установите команду запуска как npx, а аргументы — -y, -p, lionscraper, lionscraper-mcp (конкретный формат JSON см. в документации к вашему ПО).

CLI (Терминал)

При условии глобальной установки вы можете использовать lionscraper в терминале для скриптового сбора данных или параллельно с MCP (используя общие lionscraper daemon и PORT):

  • lionscraper daemon: фоновый процесс, предоставляющий HTTP (для CLI / легких MCP-вызовов) и WebSocket (для подключения расширения).

  • lionscraper stop: остановка демона на текущем порту.

  • lionscraper ping: проверка, зарегистрировано ли расширение в мосту (без участия MCP-диалога).

  • lionscraper scrape: запуск сбора данных; можно использовать --method для выбора режима (список/текст/email/телефон/ссылка/изображение), что соответствует возможностям инструментов MCP.

Пример:

lionscraper daemon
lionscraper ping
lionscraper scrape -u https://www.example.com

Более подробное описание параметров, работы с несколькими URL, пагинацией и фильтрацией см. в packages/node/README_cn.md; английская версия соответствует странице на npm: пакет lionscraper на npm.

Добавление MCP в ИИ-приложение

Примеры ниже предполагают глобальную установку (интерфейс ПО может отличаться). В MCP все значения env должны быть строками.

Простая конфигурация (если env не указан, PORT по умолчанию 13808, должен совпадать с портом моста расширения):

{
  "mcpServers": {
    "lionscraper": {
      "command": "lionscraper-mcp"
    }
  }
}

Подробная конфигурация (ключи можно удалять по необходимости; пустая строка эквивалентна пропуску ключа):

{
  "mcpServers": {
    "lionscraper": {
      "command": "lionscraper-mcp",
      "env": {
        "PORT": "13808",
        "TIMEOUT": "120000",
        "LANG": "zh-CN",
        "TOKEN": "",
        "DAEMON": ""
      }
    }
  }
}
  • PORT: порт для HTTP + WebSocket, по умолчанию 13808, должен совпадать с портом моста в расширении.

  • TIMEOUT: время ожидания (в мс) завершения предыдущего экземпляра при захвате порта, по умолчанию 120000; 0 означает принудительный захват.

  • LANG: язык описания инструментов и логов stderr (например, zh-CN, en-US).

  • TOKEN: Bearer-токен, соответствующий демону; оставьте пустым, если аутентификация не требуется.

  • DAEMON: только 0 запрещает легкому MCP автоматически запускать демона; пустое значение или другие значения эквивалентны пропуску.

После сохранения конфигурации перезапустите MCP или само приложение согласно требованиям вашего ПО, чтобы настройки вступили в силу.

Синхронизация порта в расширении браузера

  1. Откройте настройки или страницу параметров LionScraper.

  2. Найдите порт моста (или аналогичное название) и установите его равным значению PORT из конфигурации MCP (например, 13808).

  3. Если вы меняли порт или возникли проблемы с соединением, используйте кнопку «Переподключиться» в расширении; если это не помогло, попробуйте перезагрузить расширение или перезапустить браузер.

Как пользоваться ежедневно?

  1. Убедитесь, что расширение активировано, и страница, с которой нужно собрать данные, открыта в браузере (или следуйте инструкциям расширения).

  2. В чате с ИИ опишите задачу на естественном языке, например:

    • «Проверь, подключено ли расширение LionScraper.»

    • «Помоги мне собрать данные списка / текст статьи / email / телефон / ссылки / изображения с этой страницы.»

  3. ИИ вызовет расширение через MCP; если возникнет ошибка подключения или тайм-аут, попросите ИИ выполнить проверку соединения еще раз и убедитесь, что порты совпадают, а расширение включено.

Часто задаваемые вопросы

В: Появляется ошибка, что расширение не подключено или сбор данных не удался?

  • Включено ли расширение и не заблокировано ли оно?

  • Порт, настроенный в ИИ, и порт моста в расширении полностью совпадают?

  • На одном компьютере обычно достаточно одного моста между сервисом и расширением; если вы одновременно используете несколько конфигураций MCP или установили сервис несколько раз, это может вызвать конфликты.

В: В ИИ уже видны «инструменты», значит ли это, что все подключено?

Не обязательно. Наличие инструментов означает лишь то, что связь между ИИ и данным сервисом установлена; расширение также должно подключиться к тому же порту и завершить регистрацию.

MCP Registry и сторонние каталоги

Этот репозиторий зарегистрирован в официальном MCP Registry как два пакета (имена файлов метаданных — server.json):

Каталог

Имя в Registry

Описание

packages/node/server.json

io.github.dowant/lionscraper-node

Соответствует npm-пакету lionscraper, package.json содержит поле проверки mcpName

packages/python/server.json

io.github.dowant/lionscraper-python

Соответствует PyPI-пакету lionscraper, английский README.md содержит комментарий mcp-name, необходимый для описания PyPI

Краткие шаги по публикации в Registry (требуется установленный официальный CLI, см. Quickstart):

  1. Опубликуйте npm / PyPI версию, соответствующую version в server.json (в текущем примере — 1.0.3).

  2. В корне репозитория перейдите в packages/node, выполните mcp-publisher login github (один раз), затем mcp-publisher publish.

  3. Перейдите в packages/python и выполните mcp-publisher publish (можно использовать тот же логин).

У сторонних каталогов нет единой точки входа. Обычно это делается так: на Glama используйте Add Server согласно процедуре сайта; Smithery в основном ориентирован на публичный HTTPS + Streamable HTTP, что отличается от формата данного репозитория (основной упор на stdio + установка через npm/pip), поэтому перед использованием сторонних сервисов может потребоваться подготовка хостинга.

Лицензия

MIT (соответствует заявленной в npm-пакете lionscraper).

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - A tier

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/dowant/lionscraper-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server