Session Buddy

Overview Schema Related Servers Score Discussions

session-buddy
session_buddy

llm_providers.py•19.1 KiB

#!/usr/bin/env python3 """Cross-LLM Compatibility for Session Management MCP Server. Provides unified interface for multiple LLM providers including OpenAI, Google Gemini, and Ollama. """ import contextlib import json import logging import os from collections.abc import AsyncGenerator from pathlib import Path from typing import Any from session_buddy.llm import ( GeminiProvider, LLMMessage, LLMProvider, LLMResponse, OllamaProvider, OpenAIProvider, StreamChunk, StreamGenerationOptions, ) from session_buddy.settings import get_llm_api_key, get_settings # Security utilities for API key validation/masking try: from mcp_common.security import APIKeyValidator SECURITY_AVAILABLE = True except ImportError: APIKeyValidator = None # type: ignore[no-redef] SECURITY_AVAILABLE = False # Re-export for backwards compatibility __all__ = [ "SECURITY_AVAILABLE", "LLMManager", "LLMMessage", "LLMProvider", "LLMResponse", "StreamChunk", "StreamGenerationOptions", ] def _get_provider_api_key_and_env( provider: str, ) -> tuple[str | None, str | None]: """Return the provider API key and its environment variable name.""" configured_key = get_llm_api_key(provider) if configured_key: return configured_key, f"settings.{provider}_api_key" if provider == "openai": return os.getenv("OPENAI_API_KEY"), "OPENAI_API_KEY" if provider == "anthropic": return os.getenv("ANTHROPIC_API_KEY"), "ANTHROPIC_API_KEY" if provider == "gemini": if os.getenv("GEMINI_API_KEY"): return os.getenv("GEMINI_API_KEY"), "GEMINI_API_KEY" if os.getenv("GOOGLE_API_KEY"): return os.getenv("GOOGLE_API_KEY"), "GOOGLE_API_KEY" return None, "GEMINI_API_KEY" if provider == "ollama": return None, None return None, None def _get_configured_providers() -> list[str]: """Get list of configured providers based on environment variables.""" providers: set[str] = set() if get_llm_api_key("openai"): providers.add("openai") if get_llm_api_key("gemini"): providers.add("gemini") if get_llm_api_key("anthropic"): providers.add("anthropic") if os.getenv("OPENAI_API_KEY"): providers.add("openai") if os.getenv("ANTHROPIC_API_KEY"): providers.add("anthropic") if os.getenv("GEMINI_API_KEY") or os.getenv("GOOGLE_API_KEY"): providers.add("gemini") return sorted(providers) def _validate_provider_basic(provider: str, api_key: str) -> str: """Basic API key validation without security module.""" import sys if len(api_key.strip()) < 16: print( f"API Key Warning: {provider} API key appears very short", file=sys.stderr, ) return "basic_check" def _validate_provider_with_security(provider: str, api_key: str) -> tuple[bool, str]: """Validate API key with security module.""" import sys validator = APIKeyValidator(provider=provider) if APIKeyValidator else None try: if validator is None: return False, "unavailable" validator.validate(api_key, raise_on_invalid=True) print(f"✅ API Key validated for {provider}", file=sys.stderr) return True, "valid" except ValueError as exc: print(f"❌ API Key validation failed: {exc}", file=sys.stderr) sys.exit(1) def validate_llm_api_keys_at_startup() -> dict[str, str]: """Validate configured LLM API keys and return status by provider.""" import sys configured = _get_configured_providers() if not configured: print("No LLM Provider API Keys Configured", file=sys.stderr) return {} results: dict[str, str] = {} for provider in configured: api_key, env_var = _get_provider_api_key_and_env(provider) if api_key is None: continue if not api_key.strip(): print(f"❌ {env_var} is empty", file=sys.stderr) sys.exit(1) if SECURITY_AVAILABLE: _, status = _validate_provider_with_security(provider, api_key) else: status = _validate_provider_basic(provider, api_key) results[provider] = status return results def get_masked_api_key(provider: str = "openai") -> str: """Return masked API key for safe logging.""" settings = get_settings() key_field_map = { "openai": "openai_api_key", "anthropic": "anthropic_api_key", "gemini": "gemini_api_key", } key_field = key_field_map.get(provider) if key_field: configured = getattr(settings, key_field, None) if isinstance(configured, str) and configured.strip(): return settings.get_masked_key(key_name=key_field, visible_chars=4) api_key, _ = _get_provider_api_key_and_env(provider) if provider == "ollama": return "N/A (local service)" if not api_key: return "***" if SECURITY_AVAILABLE and APIKeyValidator: return APIKeyValidator.mask_key(api_key, visible_chars=4) if len(api_key) <= 4: return "***" return f"...{api_key[-4:]}" class LLMManager: """Manager for multiple LLM providers with fallback support.""" def __init__(self, config_path: str | None = None) -> None: self.providers: dict[str, LLMProvider] = {} self.config = self._load_config(config_path) self.logger = logging.getLogger("llm_providers.manager") self._initialize_providers() def _load_config(self, config_path: str | None) -> dict[str, Any]: """Load configuration from file or environment.""" config: dict[str, Any] = { "providers": {}, "default_provider": "openai", # Plan cascade: openai -> anthropic -> gemini (-> ollama future) "fallback_providers": ["anthropic", "gemini", "ollama"], } if config_path and Path(config_path).exists(): with contextlib.suppress(OSError, json.JSONDecodeError): with open(config_path, encoding="utf-8") as f: file_config = json.load(f) config.update(file_config) # Add environment-based provider configs if not config["providers"].get("openai"): config["providers"]["openai"] = { "api_key": os.getenv("OPENAI_API_KEY"), "default_model": "gpt-4", } if not config["providers"].get("anthropic"): config["providers"]["anthropic"] = { "api_key": os.getenv("ANTHROPIC_API_KEY"), "default_model": "claude-3-5-haiku-20241022", } if not config["providers"].get("gemini"): config["providers"]["gemini"] = { "api_key": os.getenv("GEMINI_API_KEY") or os.getenv("GOOGLE_API_KEY"), "default_model": "gemini-pro", } if not config["providers"].get("ollama"): config["providers"]["ollama"] = { "base_url": os.getenv("OLLAMA_BASE_URL", "http://localhost:11434"), "default_model": "llama2", } return config def _initialize_providers(self) -> None: """Initialize all configured providers.""" provider_classes = { "openai": OpenAIProvider, "anthropic": __import__( "session_buddy.llm.providers.anthropic_provider", fromlist=["AnthropicProvider"], ).AnthropicProvider, "gemini": GeminiProvider, "ollama": OllamaProvider, } for provider_name, provider_config in self.config["providers"].items(): if provider_name in provider_classes: try: self.providers[provider_name] = provider_classes[provider_name]( provider_config, ) except Exception as e: self.logger.warning( f"Failed to initialize {provider_name} provider: {e}", ) async def get_available_providers(self) -> list[str]: """Get list of available providers.""" return [ name for name, provider in self.providers.items() if await provider.is_available() ] async def generate( self, messages: list[LLMMessage], provider: str | None = None, model: str | None = None, use_fallback: bool = True, **kwargs: Any, ) -> LLMResponse: """Generate response with optional fallback.""" target_provider = provider or self.config["default_provider"] # Try primary provider result = await self._try_primary_provider_generate( target_provider, messages, model, **kwargs, ) if result is not None: return result # Try fallback providers if enabled if use_fallback: result = await self._try_fallback_providers_generate( target_provider, messages, model, **kwargs, ) if result is not None: return result msg = "No available LLM providers" raise RuntimeError(msg) async def _try_primary_provider_generate( self, target_provider: str, messages: list[LLMMessage], model: str | None, **kwargs: Any, ) -> LLMResponse | None: """Try generating with primary provider.""" if target_provider not in self.providers: return None try: provider_instance = self.providers[target_provider] if await provider_instance.is_available(): return await provider_instance.generate(messages, model, **kwargs) except Exception as e: self.logger.warning(f"Provider {target_provider} failed: {e}") return None async def _try_fallback_providers_generate( self, target_provider: str, messages: list[LLMMessage], model: str | None, **kwargs: Any, ) -> LLMResponse | None: """Try generating with fallback providers.""" for fallback_name in self.config.get("fallback_providers", []): if fallback_name in self.providers and fallback_name != target_provider: try: provider_instance = self.providers[fallback_name] if await provider_instance.is_available(): self.logger.info(f"Falling back to {fallback_name}") return await provider_instance.generate( messages, model, **kwargs, ) except Exception as e: self.logger.warning( f"Fallback provider {fallback_name} failed: {e}", ) return None def _get_fallback_providers(self, target_provider: str) -> list[str]: """Get list of fallback providers excluding the target provider.""" return [ name for name in self.config.get("fallback_providers", []) if name in self.providers and name != target_provider ] def _is_valid_provider(self, provider_name: str) -> bool: """Check if a provider is valid and available.""" return provider_name in self.providers async def _get_provider_stream( self, provider_name: str, messages: list[LLMMessage], model: str | None, **kwargs: Any, ) -> AsyncGenerator[str]: """Get stream from provider (assumes provider is available).""" provider_instance = self.providers[provider_name] async for chunk in provider_instance.stream_generate( # type: ignore[attr-defined] messages, model, **kwargs, ): yield chunk async def _try_provider_streaming( self, provider_name: str, messages: list[LLMMessage], model: str | None, **kwargs: Any, ) -> AsyncGenerator[str]: """Try streaming from a provider with error handling.""" try: provider_instance = self.providers[provider_name] if await provider_instance.is_available(): async for chunk in self._get_provider_stream( provider_name, messages, model, **kwargs, ): yield chunk except Exception as e: self.logger.warning(f"Provider {provider_name} failed: {e}") async def _select_primary_provider(self, options: StreamGenerationOptions) -> str: """Select primary provider. Target complexity: ≤3.""" target_provider = options.provider or self.config["default_provider"] if not self._is_valid_provider(target_provider): msg = f"Invalid provider: {target_provider}" raise RuntimeError(msg) return target_provider async def _try_streaming_from_provider( self, provider_name: str, messages: list[LLMMessage], options: StreamGenerationOptions, ) -> AsyncGenerator[StreamChunk]: """Try streaming from a specific provider. Target complexity: ≤6.""" try: stream_started = False async for chunk_content in self._try_provider_streaming( provider_name, messages, options.model, temperature=options.temperature, max_tokens=options.max_tokens, ): stream_started = True yield StreamChunk.content_chunk(chunk_content, provider_name) if not stream_started: yield StreamChunk.error_chunk(f"No response from {provider_name}") except Exception as e: self.logger.warning(f"Provider {provider_name} failed: {e}") yield StreamChunk.error_chunk(str(e)) async def _stream_from_primary_provider( self, primary_provider: str, messages: list[LLMMessage], options: StreamGenerationOptions, ) -> AsyncGenerator[str]: """Stream from primary provider. Target complexity: ≤4.""" has_content = False async for chunk in self._try_streaming_from_provider( primary_provider, messages, options, ): if chunk.is_error: if not has_content: # Log errors only if no content received self.logger.warning( f"Primary provider error: {chunk.metadata.get('error', 'Unknown')}", ) continue has_content = True yield chunk.content if not has_content: self.logger.debug( f"Primary provider {primary_provider} produced no content", ) async def _stream_from_fallback_providers( self, primary_provider: str, messages: list[LLMMessage], options: StreamGenerationOptions, ) -> AsyncGenerator[str]: """Stream from fallback providers. Target complexity: ≤5.""" if not options.use_fallback: return fallback_providers = self._get_fallback_providers(primary_provider) for fallback_name in fallback_providers: self.logger.info(f"Falling back to {fallback_name}") has_content = False async for chunk in self._try_streaming_from_provider( fallback_name, messages, options, ): if chunk.is_error: continue has_content = True yield chunk.content if has_content: return async def stream_generate( # type: ignore[override] self, messages: list[LLMMessage], provider: str | None = None, model: str | None = None, use_fallback: bool = True, **kwargs: Any, ) -> AsyncGenerator[str]: """Stream generate response with optional fallback. Target complexity: ≤8.""" options = StreamGenerationOptions( provider=provider, model=model, use_fallback=use_fallback, temperature=kwargs.get("temperature", 0.7), max_tokens=kwargs.get("max_tokens"), ) try: # Try primary provider first primary_provider = await self._select_primary_provider(options) async for chunk_content in self._stream_from_primary_provider( primary_provider, messages, options, ): yield chunk_content return # Success - exit early # Try fallback providers if primary failed async for chunk_content in self._stream_from_fallback_providers( primary_provider, messages, options, ): yield chunk_content return # Success - exit early # All providers failed msg = "No available LLM providers" raise RuntimeError(msg) except Exception as e: self.logger.exception(f"Stream generation failed: {e}") raise def get_provider_info(self) -> dict[str, Any]: """Get information about all providers.""" info: dict[str, Any] = { "providers": {}, "config": { "default_provider": self.config["default_provider"], "fallback_providers": self.config.get("fallback_providers", []), }, } for name, provider in self.providers.items(): info["providers"][name] = { "models": provider.get_models(), "config": { k: v for k, v in provider.config.items() if "key" not in k.lower() }, } return info async def test_providers(self) -> dict[str, Any]: """Test all providers and return status.""" test_message = [ LLMMessage(role="user", content='Hello, respond with just "OK"'), ] results = {} for name, provider in self.providers.items(): try: available = await provider.is_available() if available: # Quick test generation response = await provider.generate(test_message, max_tokens=10) results[name] = { "available": True, "test_successful": True, "response_length": len(response.content), "model": response.model, } else: results[name] = { "available": False, "test_successful": False, "error": "Provider not available", } except Exception as e: results[name] = { "available": False, "test_successful": False, "error": str(e), } return results

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/lesleslie/session-buddy'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

llm_providers.py•19.1 KiB