Web Search MCP Server

Overview Schema Related Servers Score Discussions

deduplication.py•1.46 kB

"""Result deduplication utilities.""" import logging from typing import Any, Dict, List from urllib.parse import urlparse logger = logging.getLogger(__name__) def deduplicate_results( all_results: List[Dict[str, Any]], num_results: int ) -> List[Dict[str, Any]]: """Deduplicate and rank results by quality score.""" if not all_results: return [] # Sort by quality score (descending) sorted_results = sorted( all_results, key=lambda x: x.get("quality_score", 0), reverse=True ) seen_urls = set() seen_titles = set() final_results = [] for result in sorted_results: if len(final_results) >= num_results: break url = result.get("url", "") title = result.get("title", "").lower().strip() # Normalize URL for comparison try: parsed = urlparse(url) normalized_url = f"{parsed.netloc}{parsed.path}".lower() except Exception: normalized_url = url.lower() # Skip if we've seen this URL or very similar title if normalized_url in seen_urls or title in seen_titles: continue seen_urls.add(normalized_url) seen_titles.add(title) # Add rank for final results result["rank"] = len(final_results) + 1 final_results.append(result) logger.info(f"🔄 Deduplicated {len(all_results)} → {len(final_results)} results") return final_results

Loading blob content...

Latest Blog Posts

Don't Use Large Strings as Cache Keys
By punkpeye on January 11, 2026.
markdown
node-js
cache
What are Claude Skills?
By punkpeye on January 10, 2026.
mcp
skills
How to Test MCP Streamable HTTP Endpoints Using cURL
By punkpeye on January 2, 2026.
tutorial
bash

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/vishalkg/web-search'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

deduplication.py•1.46 kB