Skip to main content
Glama
emzimmer

Mozilla Readability Parser MCP Server

by emzimmer

Mozilla 가독성 파서 MCP 서버

웹페이지 콘텐츠를 추출하여 깔끔하고 LLM 최적화된 마크다운으로 변환하는 모델 컨텍스트 프로토콜(MCP) 서버입니다. 기사 제목, 본문, 발췌문, 작성자 이름, 사이트 이름을 반환합니다. Mozilla의 가독성 알고리즘을 사용하여 핵심 콘텐츠 구조는 유지하면서 광고, 탐색 창, 푸터 및 불필요한 요소를 제거합니다. MCP에 대해 자세히 알아보세요 .

특징

  • 광고, 탐색, 바닥글 및 기타 필수적이지 않은 콘텐츠를 제거합니다.

  • 깔끔한 HTML을 잘 포맷된 Markdown으로 변환합니다(Turndown도 사용함)

  • 기사 메타데이터(제목, 발췌문, 작성자, 사이트 이름)를 반환합니다.

  • 오류를 우아하게 처리합니다

Related MCP server: Skrape MCP Server

그냥 가져오면 되지 않을까?

간단한 가져오기 요청과 달리 이 서버는 다음을 수행합니다.

  • Mozilla의 가독성 알고리즘을 사용하여 관련 콘텐츠만 추출합니다.

  • 광고, 팝업, 탐색 메뉴 등의 노이즈를 제거합니다.

  • 불필요한 HTML/CSS를 제거하여 토큰 사용량을 줄입니다.

  • 더 나은 LLM 처리를 위해 일관된 Markdown 형식을 제공합니다.

  • 콘텐츠에 대한 유용한 메타데이터가 포함되어 있습니다.

설치

Smithery를 통해 설치

Smithery를 통해 Claude Desktop용 Mozilla Readability Parser를 자동으로 설치하려면:

지엑스피1

수동 설치

npm install server-moz-readability

도구 참조

parse

웹페이지 콘텐츠를 가져와서 깔끔한 마크다운으로 변환합니다.

인수:

{ "url": { "type": "string", "description": "The website URL to parse", "required": true } }

보고:

{ "title": "Article title", "content": "Markdown content...", "metadata": { "excerpt": "Brief summary", "byline": "Author information", "siteName": "Source website name" } }

Claude Desktop과 함께 사용

claude_desktop_config.json 에 다음을 추가하세요:

{ "mcpServers": { "readability": { "command": "npx", "args": ["-y", "server-moz-readability"] } } }

종속성

  • @mozilla/readability - 콘텐츠 추출

  • 턴다운 - HTML에서 마크다운으로 변환

  • jsdom - DOM 파싱

  • axios - HTTP 요청

특허

MIT

One-click Deploy
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Tools

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/emzimmer/server-moz-readability'

If you have feedback or need assistance with the MCP directory API, please join our Discord server