KnowledgeMCP

Overview Schema Related Servers Score Discussions

KnowledgeMCP
src
processors

xlsx_processor.py•1.88 KiB

""" XLSX document processor. """ from pathlib import Path from typing import Any from openpyxl import load_workbook from src.models.document import DocumentFormat from src.processors.base import BaseProcessor from src.utils.logging_config import get_logger logger = get_logger(__name__) class XLSXProcessor(BaseProcessor): """XLSX document processor.""" @property def supported_format(self) -> DocumentFormat: return DocumentFormat.XLSX async def extract_text(self, file_path: Path) -> str: """Extract text from XLSX.""" try: wb = load_workbook(file_path, data_only=True) text_parts = [] for sheet_name in wb.sheetnames: sheet = wb[sheet_name] text_parts.append(f"Sheet: {sheet_name}") for row in sheet.iter_rows(values_only=True): row_text = "\t".join(str(cell) if cell is not None else "" for cell in row) if row_text.strip(): text_parts.append(row_text) text_parts.append("") # Blank line between sheets text = "\n".join(text_parts) logger.info(f"Extracted {len(text)} characters from XLSX: {file_path.name}") return text except Exception as e: logger.error(f"Failed to extract text from XLSX {file_path}: {e}") raise async def extract_metadata(self, file_path: Path) -> dict[str, Any]: """Extract metadata from XLSX.""" try: wb = load_workbook(file_path, data_only=True) metadata = { "sheet_count": len(wb.sheetnames), "format": "xlsx", "sheets": wb.sheetnames, } return metadata except Exception as e: logger.warning(f"Failed to extract XLSX metadata: {e}") return {"format": "xlsx"}

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/maxzrff/KnowledgeMCP'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

xlsx_processor.py•1.88 KiB