remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Integrations
Uses Mozilla's Readability algorithm to extract and transform webpage content into clean Markdown by removing ads, navigation, footers and non-essential elements while preserving core content structure.
Mozilla 가독성 파서 MCP 서버
웹페이지 콘텐츠를 추출하여 깔끔하고 LLM 최적화된 마크다운으로 변환하는 모델 컨텍스트 프로토콜(MCP) 서버입니다. 기사 제목, 본문, 발췌문, 작성자 이름, 사이트 이름을 반환합니다. Mozilla의 가독성 알고리즘을 사용하여 핵심 콘텐츠 구조는 유지하면서 광고, 탐색 창, 푸터 및 불필요한 요소를 제거합니다. MCP에 대해 자세히 알아보세요 .
특징
- 광고, 탐색, 바닥글 및 기타 필수적이지 않은 콘텐츠를 제거합니다.
- 깔끔한 HTML을 잘 포맷된 Markdown으로 변환합니다(Turndown도 사용함)
- 기사 메타데이터(제목, 발췌문, 작성자, 사이트 이름)를 반환합니다.
- 오류를 우아하게 처리합니다
그냥 가져오면 되지 않을까?
간단한 가져오기 요청과 달리 이 서버는 다음을 수행합니다.
- Mozilla의 가독성 알고리즘을 사용하여 관련 콘텐츠만 추출합니다.
- 광고, 팝업, 탐색 메뉴 등의 노이즈를 제거합니다.
- 불필요한 HTML/CSS를 제거하여 토큰 사용량을 줄입니다.
- 더 나은 LLM 처리를 위해 일관된 Markdown 형식을 제공합니다.
- 콘텐츠에 대한 유용한 메타데이터가 포함되어 있습니다.
설치
Smithery를 통해 설치
Smithery를 통해 Claude Desktop용 Mozilla Readability Parser를 자동으로 설치하려면:
지엑스피1
수동 설치
도구 참조
parse
웹페이지 콘텐츠를 가져와서 깔끔한 마크다운으로 변환합니다.
인수:
보고:
Claude Desktop과 함께 사용
claude_desktop_config.json
에 다음을 추가하세요:
종속성
- @mozilla/readability - 콘텐츠 추출
- 턴다운 - HTML에서 마크다운으로 변환
- jsdom - DOM 파싱
- axios - HTTP 요청
특허
MIT
You must be authenticated.
Tools
웹페이지 콘텐츠를 추출하여 깔끔하고 LLM 최적화된 마크다운으로 변환합니다. 기사 제목, 본문, 발췌문, 작성자, 사이트 이름을 반환합니다. Mozilla의 가독성 알고리즘을 사용하여 핵심 콘텐츠 구조는 유지하면서 광고, 탐색, 푸터 및 불필요한 요소를 제거합니다.
Appeared in Searches
- Searching for Rizhao Urban Investment's Annual Report and Rating Report for a Due Diligence Report
- Enhancing web access capabilities for Cursor
- Searching for local information or documents
- Methods to Convert Dynamic Web Content to Readable Formats like Markdown, Text, or HTML
- Gathering Information from a Company's Website Root URL