KiCad MCP Server

Overview Schema Related Servers Score Discussions

kicad-mcp
src
kicad_mcp

datasheet_lookup.py•8.89 KiB

"""Datasheet lookup via DuckDuckGo search.""" import json from pathlib import Path from urllib.parse import urlparse from typing import Optional, Dict, Tuple from ddgs import DDGS # Known manufacturer domains MFG_DOMAINS = { "TEXAS INSTRUMENTS": "ti.com", "TI": "ti.com", "STMICROELECTRONICS": "st.com", "ST": "st.com", "MICROCHIP": "microchip.com", "NXP": "nxp.com", "INFINEON": "infineon.com", "ANALOG DEVICES": "analog.com", "ADI": "analog.com", "MAXIM": "maximintegrated.com", "ON SEMICONDUCTOR": "onsemi.com", "ONSEMI": "onsemi.com", } DISTRIBUTORS = ["digikey.com", "mouser.com", "farnell.com", "arrow.com"] class DatasheetCache: """Cache for datasheet URLs.""" def __init__(self, cache_dir: Optional[Path] = None): """Initialize datasheet cache. Args: cache_dir: Directory for cache file (defaults to ~/.cache/kicad_mcp) """ if cache_dir is None: cache_dir = Path.home() / ".cache" / "kicad_mcp" cache_dir.mkdir(parents=True, exist_ok=True) self.cache_file = cache_dir / "datasheets.json" self.cache: Dict[str, str] = {} self._load_cache() def _load_cache(self) -> None: """Load cache from disk.""" if self.cache_file.exists(): try: with open(self.cache_file, 'r') as f: self.cache = json.load(f) except Exception as e: print(f"Warning: Failed to load datasheet cache: {e}") self.cache = {} def _save_cache(self) -> None: """Save cache to disk.""" try: with open(self.cache_file, 'w') as f: json.dump(self.cache, f, indent=2) except Exception as e: print(f"Warning: Failed to save datasheet cache: {e}") def _make_key(self, manufacturer: str, part_number: str) -> str: """Create cache key from manufacturer and part number.""" return f"{manufacturer.upper()}::{part_number.upper()}" def get(self, manufacturer: str, part_number: str) -> Optional[str]: """Get cached datasheet URL. Args: manufacturer: Component manufacturer part_number: Component part number Returns: Cached URL or None if not found """ key = self._make_key(manufacturer, part_number) return self.cache.get(key) def put(self, manufacturer: str, part_number: str, url: str) -> None: """Store datasheet URL in cache. Args: manufacturer: Component manufacturer part_number: Component part number url: Datasheet URL """ key = self._make_key(manufacturer, part_number) self.cache[key] = url self._save_cache() class DatasheetFinder: """Find datasheets via DuckDuckGo search.""" def __init__(self, cache_dir: Optional[Path] = None): """Initialize datasheet finder. Args: cache_dir: Directory for cache file """ self.cache = DatasheetCache(cache_dir) def _ddg_search_urls(self, query: str, max_results: int = 10) -> list[str]: """Search DuckDuckGo and return result URLs. Args: query: Search query max_results: Maximum number of results to return Returns: List of result URLs """ try: with DDGS() as ddgs: results = list(ddgs.text(query, max_results=max_results)) urls = [r['href'] for r in results if 'href' in r] return urls except Exception as e: print(f"Search failed: {e}") return [] def _canon_domain(self, mfg: str) -> Optional[str]: """Get canonical domain for manufacturer. Args: mfg: Manufacturer name Returns: Canonical domain or None """ return MFG_DOMAINS.get(mfg.strip().upper()) def _is_pdf(self, url: str) -> bool: """Check if URL points to a PDF. Args: url: URL to check Returns: True if URL appears to be a PDF """ return ".pdf" in url.lower().split("?", 1)[0] def _longest_consecutive_match(self, s1: str, s2: str) -> int: """Find the longest consecutive substring that appears in both strings. Args: s1: First string s2: Second string Returns: Length of longest consecutive match """ max_len = 0 # Check all substrings of s1 for i in range(len(s1)): for j in range(i + 1, len(s1) + 1): substring = s1[i:j] if substring in s2: max_len = max(max_len, len(substring)) return max_len def _rank_url(self, url: str, part_number: str, mfg_domain: Optional[str]) -> Tuple[int, int, int]: """Rank URL by relevance. Args: url: URL to rank part_number: Component part number mfg_domain: Expected manufacturer domain Returns: (domain_rank, match_rank, doc_type_rank) tuple - lower is better """ host = urlparse(url).netloc.lower() pn_norm = part_number.upper().replace(" ", "").replace("-", "").replace("_", "") url_upper = url.upper().replace("-", "").replace("_", "") # Rank by domain if mfg_domain and mfg_domain in host: domain_rank = 0 # Manufacturer site is best elif any(d in host for d in DISTRIBUTORS): domain_rank = 1 # Distributor sites are good else: domain_rank = 2 # Other sites # Rank by longest consecutive part number match in URL # Higher match = lower rank (better) match_length = self._longest_consecutive_match(pn_norm, url_upper) match_rank = -match_length # Negate so longer matches have lower (better) rank # Rank by document type - prefer datasheets over other docs url_lower = url.lower() if '/ds/' in url_lower or 'datasheet' in url_lower: doc_type_rank = 0 # Datasheet paths are best elif any(x in url_lower for x in ['/ug/', '/an/', '/application', '/user']): doc_type_rank = 2 # User guides and app notes are worse else: doc_type_rank = 1 # Unknown is in the middle return (domain_rank, match_rank, doc_type_rank) def find_datasheet(self, manufacturer: str, part_number: str, use_cache: bool = True) -> Optional[str]: """Find datasheet URL for a component. Args: manufacturer: Component manufacturer part_number: Component part number use_cache: Whether to use cached results Returns: Datasheet URL or None if not found """ # Check cache first if use_cache: cached = self.cache.get(manufacturer, part_number) if cached: return cached pn = part_number.strip() mfg_domain = self._canon_domain(manufacturer) # Extract base part number (remove package/variant codes) # E.g., "ADS1299IPAGR" -> "ADS1299", "STM32F407VGT6" -> "STM32F407" pn_base = pn # Common patterns: try to remove trailing package codes # Look for pattern: letters+numbers, then more letters (package code) import re match = re.match(r'^([A-Z0-9]+?)([A-Z]{2,}[0-9]*)$', pn.upper()) if match: pn_base = match.group(1) # Build search queries with filetype:pdf to get direct PDF links # Try both base part number and full part number queries = [] # Try with manufacturer domain if known if mfg_domain: # Try base part number first (more likely to find datasheet) if pn_base != pn: queries.append(f'"{manufacturer}" "{pn_base}" datasheet filetype:pdf site:{mfg_domain}') queries.append(f'"{manufacturer}" "{pn}" datasheet filetype:pdf site:{mfg_domain}') # Try general searches if pn_base != pn: queries.append(f'"{manufacturer}" "{pn_base}" datasheet filetype:pdf') queries.append(f'"{manufacturer}" "{pn}" datasheet filetype:pdf') queries.append(f'"{pn}" datasheet filetype:pdf') urls = [] for query in queries: results = self._ddg_search_urls(query, max_results=15) # Filter to only PDF URLs (filetype:pdf doesn't always guarantee PDFs) pdf_urls = [u for u in results if self._is_pdf(u)] if pdf_urls: urls.extend(pdf_urls) break # Found PDFs, no need to try more queries if not urls: return None # Sort by relevance and take best match urls.sort(key=lambda u: self._rank_url(u, pn, mfg_domain)) best_url = urls[0] # Cache the result self.cache.put(manufacturer, part_number, best_url) return best_url

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/bleugreen/kicad-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

datasheet_lookup.py•8.89 KiB