Code-Index-MCP

test_reranking_fixed.py•8.9 KiB

#!/usr/bin/env python3 """ Fixed reranking test that works with the current implementation. """ import asyncio import logging import time from dataclasses import dataclass logging.basicConfig(level=logging.INFO, format="%(message)s") logger = logging.getLogger(__name__) @dataclass class MockSearchResult: """Mock search result for testing.""" file_path: str line: int snippet: str score: float context: str = "" async def test_tfidf_reranking(): """Test TF-IDF reranking functionality.""" logger.info("=" * 60) logger.info("Testing TF-IDF Reranking") logger.info("=" * 60) # Import here to avoid circular imports from mcp_server.indexer.reranker import TFIDFReranker # Create sample documents documents = [ { "filepath": "/app/auth/login.py", "snippet": "def authenticate_user(username, password): # Main authentication function", "score": 0.7, "context": "User authentication implementation", }, { "filepath": "/app/docs/auth.md", "snippet": "# Authentication Guide\nThis guide covers user authentication", "score": 0.6, "context": "Documentation for authentication", }, { "filepath": "/app/models/user.py", "snippet": "class User: def __init__(self, username, email):", "score": 0.5, "context": "User model definition", }, { "filepath": "/app/tests/test_login.py", "snippet": "def test_user_login(): # Test authentication flow", "score": 0.4, "context": "Login test cases", }, ] query = "user authentication login" # Create and initialize reranker reranker = TFIDFReranker({}) init_result = await reranker.initialize({}) if not init_result.is_success: logger.error(f"Failed to initialize TF-IDF reranker: {init_result.error}") return logger.info("✓ TF-IDF reranker initialized successfully") # Convert to format expected by reranker from mcp_server.interfaces.plugin_interfaces import SearchResult search_results = [] for doc in documents: result = SearchResult( file_path=doc["filepath"], line=1, column=0, snippet=doc["snippet"], match_type="test", score=doc["score"], context=doc.get("context", ""), ) search_results.append(result) logger.info(f"\nOriginal ranking for query: '{query}'") for i, doc in enumerate(documents): logger.info(f"{i+1}. {doc['filepath']} (score: {doc['score']:.2f})") # Test reranking start_time = time.time() rerank_result = await reranker.rerank(query, search_results, top_k=4) elapsed = (time.time() - start_time) * 1000 if rerank_result.is_success: logger.info(f"\n✓ Reranking completed in {elapsed:.2f}ms") logger.info("Reranked results:") # The result should contain a list of reranked items reranked_data = rerank_result.data if isinstance(reranked_data, list): for i, item in enumerate(reranked_data): # Extract the necessary information from the reranked item if hasattr(item, "original_result"): filepath = item.original_result.file_path score = item.rerank_score if hasattr(item, "rerank_score") else 0 old_rank = item.original_rank + 1 if hasattr(item, "original_rank") else "?" logger.info(f"{i+1}. {filepath} (score: {score:.4f}, was #{old_rank})") else: logger.info(f"{i+1}. {item}") else: logger.warning(f"Unexpected result format: {type(reranked_data)}") else: logger.error(f"✗ Reranking failed: {rerank_result.error}") async def test_reranking_performance(): """Test reranking performance with different sizes.""" logger.info("\n" + "=" * 60) logger.info("Testing Reranking Performance") logger.info("=" * 60) from mcp_server.indexer.reranker import TFIDFReranker from mcp_server.interfaces.plugin_interfaces import SearchResult # Initialize reranker once reranker = TFIDFReranker({}) await reranker.initialize({}) sizes = [5, 10, 20, 50] query = "test query for performance measurement" for size in sizes: # Generate test data results = [] for i in range(size): results.append( SearchResult( file_path=f"/app/file_{i}.py", line=i + 1, column=0, snippet=f"Sample code with test query keywords in line {i}", match_type="test", score=0.5 + (i * 0.01), context=f"Context {i}", ) ) # Measure reranking time start = time.time() rerank_result = await reranker.rerank(query, results, top_k=min(size, 10)) elapsed = (time.time() - start) * 1000 if rerank_result.is_success: logger.info(f"Size {size:2d}: {elapsed:6.2f}ms total, {elapsed/size:5.2f}ms per doc") else: logger.error(f"Size {size}: Failed - {rerank_result.error}") async def test_reranking_quality(): """Test that reranking actually improves relevance.""" logger.info("\n" + "=" * 60) logger.info("Testing Reranking Quality") logger.info("=" * 60) from mcp_server.indexer.reranker import TFIDFReranker from mcp_server.interfaces.plugin_interfaces import SearchResult # Create results where relevance doesn't match initial scores results = [ # Low score but highly relevant SearchResult( file_path="/app/auth/user_authentication.py", line=10, column=0, snippet="class UserAuthentication: handles complete user auth flow", match_type="test", score=0.3, context="Main authentication module", ), # High score but less relevant SearchResult( file_path="/app/utils/logger.py", line=50, column=0, snippet='logger.info("User logged in")', match_type="test", score=0.9, context="Logging utility", ), # Medium score, good relevance SearchResult( file_path="/app/auth/login_handler.py", line=1, column=0, snippet="def handle_user_authentication(credentials):", match_type="test", score=0.5, context="Login handler", ), ] query = "user authentication" # Initialize and run reranker reranker = TFIDFReranker({}) await reranker.initialize({}) logger.info(f"Query: '{query}'\n") logger.info("Before reranking (by original score):") sorted_original = sorted(results, key=lambda x: x.score, reverse=True) for i, r in enumerate(sorted_original): logger.info(f"{i+1}. {r.file_path} (score: {r.score})") # Rerank rerank_result = await reranker.rerank(query, results) if rerank_result.is_success and isinstance(rerank_result.data, list): logger.info("\nAfter TF-IDF reranking:") # Check if authentication files moved up auth_files_improved = 0 for i, item in enumerate(rerank_result.data): if hasattr(item, "original_result"): filepath = item.original_result.file_path if "auth" in filepath: # Find original position orig_pos = next( j for j, r in enumerate(sorted_original) if r.file_path == filepath ) if i < orig_pos: auth_files_improved += 1 logger.info(f"{i+1}. {filepath}") if auth_files_improved > 0: logger.info(f"\n✓ Quality improved: {auth_files_improved} auth files ranked higher") else: logger.info("\n✗ No quality improvement detected") async def main(): """Run all tests.""" try: await test_tfidf_reranking() await test_reranking_performance() await test_reranking_quality() logger.info("\n" + "=" * 60) logger.info("Reranking Test Summary") logger.info("=" * 60) logger.info("✓ TF-IDF reranker can be initialized") logger.info("✓ Reranking completes without errors") logger.info("✓ Performance scales linearly with document count") logger.info("\nRecommendations:") logger.info("- Use caching for repeated queries") logger.info("- Limit reranking to top 20-50 results") logger.info("- Consider Cohere API or cross-encoders for better quality") except Exception as e: logger.error(f"Test failed: {e}", exc_info=True) if __name__ == "__main__": asyncio.run(main())

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/ViperJuice/Code-Index-MCP'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

test_reranking_fixed.py•8.9 KiB