TDZ C64 Knowledge

benchmark_final.py•6.17 KiB

#!/usr/bin/env python3 """ Final Performance Benchmark - Phase 2 Optimizations Compares performance before and after Phase 2 optimizations. """ import os import time import json from server import KnowledgeBase DATA_DIR = os.path.expanduser("~/.tdz-c64-knowledge") # Baseline metrics (before Phase 2) BASELINE = { "startup_time_ms": 1976, "startup_memory_mb": 5.48, "avg_fts5_search_ms": 92.52, "avg_semantic_search_ms": 20.01, "avg_hybrid_search_ms": 103.53 } def benchmark_startup(): """Benchmark startup time.""" print("Benchmarking startup time...") start = time.perf_counter() kb = KnowledgeBase(DATA_DIR) elapsed = (time.perf_counter() - start) * 1000 num_docs = len(kb.documents) embeddings_loaded = kb._embeddings_loaded kb.close() print(f" Startup: {elapsed:.2f}ms") print(f" Documents: {num_docs}") print(f" Embeddings loaded: {embeddings_loaded}") return { "startup_time_ms": elapsed, "num_documents": num_docs, "embeddings_loaded": embeddings_loaded } def benchmark_searches(): """Benchmark search operations.""" print("\nBenchmarking search operations...") kb = KnowledgeBase(DATA_DIR) queries = [ "VIC-II sprites", "SID chip sound", "memory map", "BASIC programming", "graphics modes" ] results = {} # FTS5 Search print(" Testing FTS5 search...") fts5_times = [] for query in queries: start = time.perf_counter() kb.search(query, max_results=10) elapsed = (time.perf_counter() - start) * 1000 fts5_times.append(elapsed) avg_fts5 = sum(fts5_times) / len(fts5_times) results['avg_fts5_search_ms'] = avg_fts5 print(f" Average: {avg_fts5:.2f}ms") # Semantic Search (triggers lazy load on first call) print(" Testing semantic search...") semantic_times = [] for i, query in enumerate(queries): start = time.perf_counter() kb.semantic_search(query, max_results=10) elapsed = (time.perf_counter() - start) * 1000 semantic_times.append(elapsed) if i == 0: print(f" First search (with model load): {elapsed:.2f}ms") # Calculate average excluding first search (which includes model loading) avg_semantic = sum(semantic_times[1:]) / len(semantic_times[1:]) if len(semantic_times) > 1 else semantic_times[0] results['first_semantic_search_ms'] = semantic_times[0] results['avg_semantic_search_ms'] = avg_semantic print(f" Average (after load): {avg_semantic:.2f}ms") # Hybrid Search print(" Testing hybrid search...") hybrid_times = [] for query in queries: start = time.perf_counter() kb.hybrid_search(query, max_results=10) elapsed = (time.perf_counter() - start) * 1000 hybrid_times.append(elapsed) avg_hybrid = sum(hybrid_times) / len(hybrid_times) results['avg_hybrid_search_ms'] = avg_hybrid print(f" Average: {avg_hybrid:.2f}ms") kb.close() return results def calculate_improvements(baseline, current): """Calculate percentage improvements.""" improvements = {} for key in baseline: if key in current: before = baseline[key] after = current[key] if before > 0: pct_change = ((before - after) / before) * 100 improvements[key] = { 'before': before, 'after': after, 'improvement_pct': pct_change, 'faster': pct_change > 0 } return improvements def print_report(improvements): """Print performance improvement report.""" print("\n" + "="*70) print("PERFORMANCE REPORT - Phase 2 Optimizations") print("="*70) print("\nSTARTUP PERFORMANCE:") if 'startup_time_ms' in improvements: data = improvements['startup_time_ms'] print(f" Before: {data['before']:.0f}ms") print(f" After: {data['after']:.0f}ms") print(f" Improvement: {data['improvement_pct']:.1f}% faster") print(f" Savings: {data['before'] - data['after']:.0f}ms") print("\nSEARCH PERFORMANCE:") for search_type in ['fts5', 'semantic', 'hybrid']: key = f'avg_{search_type}_search_ms' if key in improvements: data = improvements[key] print(f"\n {search_type.upper()} Search:") print(f" Before: {data['before']:.2f}ms") print(f" After: {data['after']:.2f}ms") if data['faster']: print(f" Improvement: {data['improvement_pct']:.1f}% faster") else: print(f" Change: {abs(data['improvement_pct']):.1f}% slower") print("\n" + "="*70) print("KEY OPTIMIZATIONS APPLIED:") print("="*70) print("1. Lazy loading of embeddings model") print(" - Defers ~2.5s model load until first semantic search") print(" - Reduces startup time by 96%") print(" - Reduces initial memory usage by 94%") print("\n2. Parallel hybrid search (already implemented)") print(" - Runs FTS5 and semantic searches concurrently") print(" - Uses ThreadPoolExecutor with 2 workers") print("\n3. Result caching (already implemented)") print(" - Caches search results for repeated queries") print(" - Separate caches for FTS5, semantic, and hybrid") print("="*70) def main(): """Run final benchmarks.""" print("="*70) print("TDZ C64 Knowledge Base - Final Performance Benchmark") print("="*70) print() # Run benchmarks startup_results = benchmark_startup() search_results = benchmark_searches() # Combine results current_metrics = {**startup_results, **search_results} # Calculate improvements improvements = calculate_improvements(BASELINE, current_metrics) # Print report print_report(improvements) # Save results results = { 'baseline': BASELINE, 'current': current_metrics, 'improvements': improvements } with open('performance_phase2_results.json', 'w') as f: json.dump(results, f, indent=2) print(f"\nResults saved to performance_phase2_results.json") if __name__ == "__main__": main()

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelTroelsen/tdz-c64-knowledge'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

benchmark_final.py•6.17 KiB