Skip to main content
Glama

Mozilla Readability Parser MCP Server

by emzimmer

Mozilla 가독성 파서 MCP 서버

웹페이지 콘텐츠를 추출하여 깔끔하고 LLM 최적화된 마크다운으로 변환하는 모델 컨텍스트 프로토콜(MCP) 서버입니다. 기사 제목, 본문, 발췌문, 작성자 이름, 사이트 이름을 반환합니다. Mozilla의 가독성 알고리즘을 사용하여 핵심 콘텐츠 구조는 유지하면서 광고, 탐색 창, 푸터 및 불필요한 요소를 제거합니다. MCP에 대해 자세히 알아보세요 .

특징

  • 광고, 탐색, 바닥글 및 기타 필수적이지 않은 콘텐츠를 제거합니다.
  • 깔끔한 HTML을 잘 포맷된 Markdown으로 변환합니다(Turndown도 사용함)
  • 기사 메타데이터(제목, 발췌문, 작성자, 사이트 이름)를 반환합니다.
  • 오류를 우아하게 처리합니다

그냥 가져오면 되지 않을까?

간단한 가져오기 요청과 달리 이 서버는 다음을 수행합니다.

  • Mozilla의 가독성 알고리즘을 사용하여 관련 콘텐츠만 추출합니다.
  • 광고, 팝업, 탐색 메뉴 등의 노이즈를 제거합니다.
  • 불필요한 HTML/CSS를 제거하여 토큰 사용량을 줄입니다.
  • 더 나은 LLM 처리를 위해 일관된 Markdown 형식을 제공합니다.
  • 콘텐츠에 대한 유용한 메타데이터가 포함되어 있습니다.

설치

Smithery를 통해 설치

Smithery를 통해 Claude Desktop용 Mozilla Readability Parser를 자동으로 설치하려면:

지엑스피1

수동 설치

npm install server-moz-readability

도구 참조

parse

웹페이지 콘텐츠를 가져와서 깔끔한 마크다운으로 변환합니다.

인수:

{ "url": { "type": "string", "description": "The website URL to parse", "required": true } }

보고:

{ "title": "Article title", "content": "Markdown content...", "metadata": { "excerpt": "Brief summary", "byline": "Author information", "siteName": "Source website name" } }

Claude Desktop과 함께 사용

claude_desktop_config.json 에 다음을 추가하세요:

{ "mcpServers": { "readability": { "command": "npx", "args": ["-y", "server-moz-readability"] } } }

종속성

  • @mozilla/readability - 콘텐츠 추출
  • 턴다운 - HTML에서 마크다운으로 변환
  • jsdom - DOM 파싱
  • axios - HTTP 요청

특허

MIT

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Tools

웹페이지 콘텐츠를 추출하여 깔끔하고 LLM 최적화된 마크다운으로 변환합니다. 기사 제목, 본문, 발췌문, 작성자, 사이트 이름을 반환합니다. Mozilla의 가독성 알고리즘을 사용하여 핵심 콘텐츠 구조는 유지하면서 광고, 탐색, 푸터 및 불필요한 요소를 제거합니다.

  1. 특징
    1. 그냥 가져오면 되지 않을까?
      1. 설치
        1. Smithery를 통해 설치
        2. 수동 설치
      2. 도구 참조
        1. parse
      3. Claude Desktop과 함께 사용
        1. 종속성
          1. 특허

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              This server enables LLMs to retrieve and process content from web pages, converting HTML to markdown for easier consumption.
              Last updated -
              1
              50,383
              Python
              MIT License
              • Linux
              • Apple
            • A
              security
              A
              license
              A
              quality
              Provides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.
              Last updated -
              4
              125,855
              353
              TypeScript
              MIT License
            • A
              security
              A
              license
              A
              quality
              This server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.
              Last updated -
              1
              5
              JavaScript
              MIT License
              • Apple
            • -
              security
              A
              license
              -
              quality
              Enables retrieval and processing of web page content for LLMs by converting HTML to markdown, with support for content truncation and pagination.
              Last updated -
              1
              1
              Python
              MIT License

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/emzimmer/server-moz-readability'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server