Prysm MCP Server

by pinkpixel-dev
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Allows formatting scraped web content into structured markdown, with support for including images and saving formatted results to files

  • Uses Puppeteer to perform web scraping with capabilities like smart scrolling for single-page applications and content analysis to determine optimal scraping approaches

🔍 Prysm MCP 서버

Prysm MCP(Model Context Protocol) 서버는 Claude와 다른 AI 도우미가 높은 정확도와 유연성을 갖추고 웹 콘텐츠를 스크래핑할 수 있도록 해줍니다.

✨ 특징

  • 🎯 다중 스크래핑 모드 : 집중(속도), 균형(기본), 심층(철저) 모드 중에서 선택하세요
  • 🧠 콘텐츠 분석 : URL을 분석하여 최상의 스크래핑 접근 방식을 결정합니다.
  • 📄 형식 유연성 : 결과를 마크다운, HTML 또는 JSON으로 형식화합니다.
  • 🖼️ 이미지 지원 : 선택적으로 이미지를 추출하고 다운로드할 수 있습니다.
  • 🔍 스마트 스크롤링 : 단일 페이지 애플리케이션에 대한 스크롤 동작 구성
  • 📱 반응형 : 다양한 웹사이트 레이아웃과 구조에 적응합니다.
  • 💾 파일 출력 : 원하는 디렉토리에 서식이 지정된 결과를 저장합니다.

🚀 빠른 시작

설치

지엑스피1

통합 가이드

우리는 인기 있는 MCP 호환 애플리케이션에 대한 자세한 통합 가이드를 제공합니다:

용법

Prysm MCP 서버를 설정하는 방법은 여러 가지가 있습니다.

mcp.json 구성 사용

위의 가이드에 따라 적절한 위치에 mcp.json 파일을 만듭니다.

{ "mcpServers": { "prysm-scraper": { "description": "Prysm web scraper with custom output directories", "command": "npx", "args": [ "-y", "@pinkpixel/prysm-mcp" ], "env": { "PRYSM_OUTPUT_DIR": "${workspaceFolder}/scrape_results", "PRYSM_IMAGE_OUTPUT_DIR": "${workspaceFolder}/scrape_results/images" } } } }

🛠️ 도구

서버는 다음과 같은 도구를 제공합니다.

scrapeFocused

속도에 최적화된 빠른 웹 스크래핑(스크롤 감소, 주요 콘텐츠만 제공).

Please scrape https://example.com using the focused mode

사용 가능한 매개변수:

  • url (필수): 스크래핑할 URL
  • maxScrolls (선택 사항): 스크롤 시도의 최대 횟수(기본값: 5)
  • scrollDelay (선택 사항): 스크롤 간 지연 시간(ms)(기본값: 1000)
  • scrapeImages (선택 사항): 결과에 이미지를 포함할지 여부
  • downloadImages (선택 사항): 이미지를 로컬로 다운로드할지 여부
  • maxImages (선택 사항): 추출할 최대 이미지 수
  • output (선택 사항): 다운로드한 이미지의 출력 디렉토리

scrapeBalanced

적절한 속도와 좋은 커버리지를 갖춘 균형 잡힌 웹 스크래핑 방식입니다.

Please scrape https://example.com using the balanced mode

사용 가능한 매개변수:

  • scrapeFocused 와 동일하며 다른 기본값을 사용합니다.
  • maxScrolls 기본값: 10
  • scrollDelay 기본값: 2000
  • 총 스크래핑 시간을 제한하기 위해 timeout 매개변수를 추가합니다(기본값: 30000ms)

scrapeDeep

최대 추출 웹 스크래핑(느리지만 철저함).

Please scrape https://example.com using the deep mode with maximum scrolls

사용 가능한 매개변수:

  • scrapeFocused 와 동일하며 다른 기본값을 사용합니다.
  • maxScrolls 기본값: 20
  • scrollDelay 기본값: 3000
  • maxImages 기본값: 100

formatResult

스크래핑한 데이터를 다양한 구조화된 형식(마크다운, HTML, JSON)으로 포맷합니다.

Format the scraped data as markdown

사용 가능한 매개변수:

  • data (필수): 포맷할 스크래핑된 데이터
  • format (필수): 출력 형식 - "markdown", "html" 또는 "json"
  • includeImages (선택 사항): 출력에 이미지를 포함할지 여부(기본값: true)
  • output (선택 사항): 포맷된 결과를 저장할 파일 경로

출력 경로를 지정하여 서식이 지정된 결과를 파일에 저장할 수도 있습니다.

Format the scraped data as markdown and save it to "my-results/output.md"

⚙️ 구성

출력 디렉토리

기본적으로 서식이 적용된 결과를 저장할 때 파일은 ~/prysm-mcp/output/ 에 저장됩니다. 다음 두 가지 방법으로 이 설정을 사용자 지정할 수 있습니다.

  1. 환경 변수 : 원하는 디렉토리에 환경 변수를 설정합니다.
# Linux/macOS export PRYSM_OUTPUT_DIR="/path/to/custom/directory" export PRYSM_IMAGE_OUTPUT_DIR="/path/to/custom/image/directory" # Windows (Command Prompt) set PRYSM_OUTPUT_DIR=C:\path\to\custom\directory set PRYSM_IMAGE_OUTPUT_DIR=C:\path\to\custom\image\directory # Windows (PowerShell) $env:PRYSM_OUTPUT_DIR="C:\path\to\custom\directory" $env:PRYSM_IMAGE_OUTPUT_DIR="C:\path\to\custom\image\directory"
  1. 도구 매개변수 : 도구를 호출할 때 출력 경로를 직접 지정합니다.
# For general results Format the scraped data as markdown and save it to "/absolute/path/to/file.md" # For image downloads when scraping Please scrape https://example.com and download images to "/absolute/path/to/images"
  1. MCP 구성 : MCP 구성 파일(예: .cursor/mcp.json )에서 다음 환경 변수를 설정할 수 있습니다.
{ "mcpServers": { "prysm-scraper": { "command": "npx", "args": ["-y", "@pinkpixel/prysm-mcp"], "env": { "PRYSM_OUTPUT_DIR": "${workspaceFolder}/scrape_results", "PRYSM_IMAGE_OUTPUT_DIR": "${workspaceFolder}/scrape_results/images" } } } }

PRYSM_IMAGE_OUTPUT_DIR 지정되지 않으면 PRYSM_OUTPUT_DIR 내부의 images 라는 하위 폴더로 기본 설정됩니다.

상대 경로나 파일 이름만 제공하는 경우 구성된 출력 디렉토리를 기준으로 저장됩니다.

경로 처리 규칙

formatResult 도구는 다음과 같은 방법으로 경로를 처리합니다.

  • 절대 경로 : 제공된 대로 정확하게 사용됨( /home/user/file.md )
  • 상대 경로 : 구성된 출력 디렉토리( subfolder/file.md )를 기준으로 저장됩니다.
  • 파일 이름만 : 구성된 출력 디렉토리( output.md )에 저장됨
  • 디렉토리 경로 : 경로가 디렉토리를 가리키는 경우 콘텐츠와 타임스탬프를 기반으로 파일 이름이 자동 생성됩니다.

🏗️ 개발

# Install dependencies npm install # Build the project npm run build # Run the server locally node bin/prysm-mcp # Debug MCP communication DEBUG=mcp:* node bin/prysm-mcp # Set custom output directories PRYSM_OUTPUT_DIR=./my-output PRYSM_IMAGE_OUTPUT_DIR=./my-output/images node bin/prysm-mcp

npx를 통해 실행

npx를 설치하지 않고도 서버를 직접 실행할 수 있습니다.

# Run with default settings npx @pinkpixel/prysm-mcp # Run with custom output directories PRYSM_OUTPUT_DIR=./my-output PRYSM_IMAGE_OUTPUT_DIR=./my-output/images npx @pinkpixel/prysm-mcp

📋 라이센스

MIT

🙏 크레딧

핑크픽셀 에서 개발

모델 컨텍스트 프로토콜Puppeteer 기반

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

AI 도우미가 높은 정확도와 유연성으로 웹 콘텐츠를 스크래핑할 수 있도록 하는 모델 컨텍스트 프로토콜 서버로, 다양한 스크래핑 모드와 콘텐츠 서식 옵션을 지원합니다.

  1. ✨ Features
    1. 🚀 Quick Start
      1. Installation
      2. Integration Guides
      3. Usage
    2. 🛠️ Tools
      1. scrapeFocused
      2. scrapeBalanced
      3. scrapeDeep
      4. formatResult
    3. ⚙️ Configuration
      1. Output Directory
      2. Path Handling Rules
    4. 🏗️ Development
      1. Running via npx
    5. 📋 License
      1. 🙏 Credits
        ID: i1xotvaxqx