Текстовый MCP-сервер
TextIn MCP Server — это инструмент для извлечения текста и выполнения OCR на документах, включая распознавание текста документов, распознавание идентификаторов и распознавание счетов-фактур. Он также поддерживает преобразование документов в формат Markdown.
Инструменты
recognition_text
- Распознавание текста из изображений, документов Word и файлов PDF.
- Входные данные:
path
(строка, обязательно):file path
илиa URL (HTTP/HTTPS) pointing to a document
- Возврат: Текст документа.
- Поддерживает преобразование для:
- Изображение (Jpeg, Jpg, PNG, Bmp)
doc_to_markdown
- Конвертируйте изображения, PDF-файлы и документы Word в Markdown.
- Входные данные:
path
(строка, обязательно):file path
илиa URL (HTTP/HTTPS) pointing to a document
- Возврат: Уценка документа.
- Поддерживает преобразование для:
- Документы Microsoft Office (Word, Excel)
- Изображение (Jpeg, Jpg, PNG, Bmp)
general_information_extration
- Автоматически идентифицируйте и извлекайте информацию из документов или идентифицируйте и извлекайте указанную пользователем информацию.
- Входные данные:
path
(строка, обязательно):file path
илиa URL (HTTP/HTTPS) pointing to a document
key
(string[], необязательно): нетабличная текстовая информация, которую пользователь хочет идентифицировать, формат ввода — массив строк.table_header
(string[], необязательно): информация о таблице, которую пользователь хочет идентифицировать, формат ввода — массив строк.
- Возврат: ключевая информация JSON.
- Поддерживает преобразование для:
- Документы Microsoft Office (Word, Excel)
- Изображение (Jpeg, Jpg, PNG, Bmp)
Если входными данными является URL-адрес, он не поддерживает обработку доступа к защищенным ресурсам.
Настраивать
APP_ID и APP_SECRET
Нажмите здесь , чтобы зарегистрировать учетную запись TextIn.
Получите Textin APP_ID и APP_SECRET, следуя инструкциям здесь .
НПХ
Лицензия
Этот сервер MCP лицензирован по лицензии MIT. Это означает, что вы можете свободно использовать, изменять и распространять программное обеспечение в соответствии с условиями лицензии MIT. Для получения более подробной информации см. файл LICENSE в репозитории проекта.
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Сервер, который позволяет использовать возможности OCR для распознавания текста из изображений, PDF-файлов и документов Word, преобразования их в Markdown и извлечения ключевой информации.
Related MCP Servers
- AsecurityAlicenseAqualityA document conversion server that transforms various file formats (PDFs, documents, images, audio, web content) to Markdown with improved multilingual and UTF-8 support.Last updated -104TypeScriptMIT License
- -securityAlicense-qualityA server that provides document processing capabilities using the Model Context Protocol, allowing conversion of documents to markdown, extraction of tables, and processing of document images.Last updated -6PythonMIT License
- AsecurityFlicenseAqualityAn MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.Last updated -15Python
- -securityFlicense-qualityEnables integration between MCP clients and the Handwriting OCR service, allowing users to upload images and PDF documents, check processing status, and retrieve OCR results as Markdown.Last updated -1JavaScript