hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Integrations
Converts arXiv PDF documents to markdown format, with support for table extraction and image extraction from the documents.
Integrates with Llama Stack (hosted on GitHub) to provide document processing capabilities to LLM applications built with the Llama Stack framework.
Converts various document formats to markdown, with support for embedded images extraction and OCR capabilities for scanned documents.
MCP 도클링 서버
Docling 라이브러리를 사용하여 문서 처리 기능을 제공하는 MCP 서버입니다.
설치
pip를 사용하여 패키지를 설치할 수 있습니다.
지엑스피1
용법
stdio(기본값) 또는 SSE 전송을 사용하여 서버를 시작합니다.
uv를 사용하는 경우 설치하지 않고도 서버를 직접 실행할 수 있습니다.
사용 가능한 도구
서버는 다음 도구를 제공합니다.
- convert_document : URL 또는 로컬 경로의 문서를 마크다운 형식으로 변환합니다.
source
: 문서의 URL 또는 로컬 파일 경로(필수)enable_ocr
: 스캔된 문서에 대해 OCR을 활성화할지 여부(선택 사항, 기본값: false)ocr_language
: OCR에 대한 언어 코드 목록, 예: ["en", "fr"] (선택 사항)
- convert_document_with_images : 문서를 변환하고 내장된 이미지를 추출합니다.
source
: 문서의 URL 또는 로컬 파일 경로(필수)enable_ocr
: 스캔된 문서에 대해 OCR을 활성화할지 여부(선택 사항, 기본값: false)ocr_language
: OCR 언어 코드 목록(선택 사항)
- extract_tables : 문서에서 테이블을 구조화된 데이터로 추출합니다.
source
: 문서의 URL 또는 로컬 파일 경로(필수)
- convert_batch : 일괄 모드로 여러 문서를 처리합니다.
sources
: 문서의 URL 또는 파일 경로 목록(필수)enable_ocr
: 스캔된 문서에 대해 OCR을 활성화할지 여부(선택 사항, 기본값: false)ocr_language
: OCR 언어 코드 목록(선택 사항)
- qna_from_document : URL 또는 로컬 경로에서 YAML 형식으로 Q&A 문서를 만듭니다.
source
: 문서의 URL 또는 로컬 파일 경로(필수)no_of_qnas
: 예상 Q&A 수(선택 사항, 기본값: 5)- 참고 : 이 도구를 사용하려면 IBM Watson X 자격 증명을 환경 변수로 설정해야 합니다.
WATSONX_PROJECT_ID
: Watson X 프로젝트 IDWATSONX_APIKEY
: IBM Cloud API 키WATSONX_URL
: Watson X API URL(기본값: https://us-south.ml.cloud.ibm.com )
- get_system_info : 시스템 구성 및 가속 상태에 대한 정보를 가져옵니다.
라마 스택의 예
https://github.com/user-attachments/assets/8ad34e50-cbf7-4ec8-aedd-71c42a5de0a1
이 서버를 Llama Stack 과 함께 사용하면 LLM 애플리케이션에 문서 처리 기능을 제공할 수 있습니다. Llama Stack 서버가 실행 중인지 확인한 후 INFERENCE_MODEL
구성하세요.
캐싱
서버는 반복되는 요청에 대한 성능을 향상시키기 위해 처리된 문서를 ~/.cache/mcp-docling/
에 캐시합니다.
This server cannot be installed
모델 컨텍스트 프로토콜을 사용하여 문서 처리 기능을 제공하는 서버로, 문서를 마크다운으로 변환하고, 표를 추출하고, 문서 이미지를 처리할 수 있습니다.