MaverickMCP

persistence.py•28.4 KiB

""" Backtesting persistence layer for saving and retrieving backtest results. This module provides comprehensive database operations for backtest results, including saving VectorBT results, querying historical tests, and comparing multiple backtests with proper error handling. """ import logging from datetime import datetime, timedelta from decimal import Decimal, InvalidOperation from typing import Any from uuid import UUID, uuid4 import pandas as pd from sqlalchemy import desc from sqlalchemy.exc import SQLAlchemyError from sqlalchemy.orm import Session from maverick_mcp.data.models import ( BacktestResult, BacktestTrade, OptimizationResult, SessionLocal, WalkForwardTest, ) logger = logging.getLogger(__name__) class BacktestPersistenceError(Exception): """Custom exception for backtest persistence operations.""" pass class BacktestPersistenceManager: """Manages persistence of backtesting results with comprehensive error handling.""" def __init__(self, session: Session | None = None): """Initialize persistence manager. Args: session: Optional SQLAlchemy session. If None, creates a new one. """ self.session = session self._owns_session = session is None def __enter__(self): """Context manager entry.""" if self._owns_session: self.session = SessionLocal() return self def __exit__(self, exc_type, exc_val, exc_tb): """Context manager exit with proper cleanup.""" if self._owns_session and self.session: if exc_type is None: self.session.commit() else: self.session.rollback() self.session.close() def save_backtest_result( self, vectorbt_results: dict[str, Any], execution_time: float | None = None, notes: str | None = None, ) -> str: """ Save VectorBT backtest results to database. Args: vectorbt_results: Results dictionary from VectorBTEngine execution_time: Time taken to run the backtest in seconds notes: Optional user notes Returns: UUID string of the saved backtest Raises: BacktestPersistenceError: If saving fails """ try: # Extract basic metadata symbol = vectorbt_results.get("symbol", "").upper() strategy_type = vectorbt_results.get("strategy", "") parameters = vectorbt_results.get("parameters", {}) metrics = vectorbt_results.get("metrics", {}) if not symbol or not strategy_type: raise BacktestPersistenceError("Symbol and strategy type are required") # Create backtest result record backtest_result = BacktestResult( backtest_id=uuid4(), symbol=symbol, strategy_type=strategy_type, backtest_date=datetime.utcnow(), # Date range start_date=pd.to_datetime(vectorbt_results.get("start_date")).date(), end_date=pd.to_datetime(vectorbt_results.get("end_date")).date(), initial_capital=Decimal( str(vectorbt_results.get("initial_capital", 10000)) ), # Strategy parameters parameters=parameters, # Performance metrics total_return=self._safe_decimal(metrics.get("total_return")), annualized_return=self._safe_decimal(metrics.get("annualized_return")), sharpe_ratio=self._safe_decimal(metrics.get("sharpe_ratio")), sortino_ratio=self._safe_decimal(metrics.get("sortino_ratio")), calmar_ratio=self._safe_decimal(metrics.get("calmar_ratio")), # Risk metrics max_drawdown=self._safe_decimal(metrics.get("max_drawdown")), max_drawdown_duration=metrics.get("max_drawdown_duration"), volatility=self._safe_decimal(metrics.get("volatility")), downside_volatility=self._safe_decimal( metrics.get("downside_volatility") ), # Trade statistics total_trades=metrics.get("total_trades", 0), winning_trades=metrics.get("winning_trades", 0), losing_trades=metrics.get("losing_trades", 0), win_rate=self._safe_decimal(metrics.get("win_rate")), # P&L statistics profit_factor=self._safe_decimal(metrics.get("profit_factor")), average_win=self._safe_decimal(metrics.get("average_win")), average_loss=self._safe_decimal(metrics.get("average_loss")), largest_win=self._safe_decimal(metrics.get("largest_win")), largest_loss=self._safe_decimal(metrics.get("largest_loss")), # Portfolio values final_portfolio_value=self._safe_decimal(metrics.get("final_value")), peak_portfolio_value=self._safe_decimal(metrics.get("peak_value")), # Market analysis beta=self._safe_decimal(metrics.get("beta")), alpha=self._safe_decimal(metrics.get("alpha")), # Time series data equity_curve=vectorbt_results.get("equity_curve"), drawdown_series=vectorbt_results.get("drawdown_series"), # Execution metadata execution_time_seconds=Decimal(str(execution_time)) if execution_time else None, data_points=len(vectorbt_results.get("equity_curve", [])), # Status status="completed", notes=notes, ) self.session.add(backtest_result) self.session.flush() # Get the ID without committing # Save individual trades if available trades_data = vectorbt_results.get("trades", []) if trades_data: self._save_trades(backtest_result.backtest_id, trades_data) self.session.commit() logger.info(f"Saved backtest result: {backtest_result.backtest_id}") return str(backtest_result.backtest_id) except SQLAlchemyError as e: self.session.rollback() logger.error(f"Database error saving backtest: {e}") raise BacktestPersistenceError(f"Failed to save backtest: {e}") except Exception as e: self.session.rollback() logger.error(f"Unexpected error saving backtest: {e}") raise BacktestPersistenceError(f"Unexpected error: {e}") def _save_trades( self, backtest_id: UUID, trades_data: list[dict[str, Any]] ) -> None: """Save individual trade records.""" try: trades = [] for i, trade in enumerate(trades_data, 1): trade_record = BacktestTrade( trade_id=uuid4(), backtest_id=backtest_id, trade_number=i, # Entry details entry_date=pd.to_datetime(trade.get("entry_date")).date(), entry_price=self._safe_decimal(trade.get("entry_price")), entry_time=pd.to_datetime(trade.get("entry_time")) if trade.get("entry_time") else None, # Exit details exit_date=pd.to_datetime(trade.get("exit_date")).date() if trade.get("exit_date") else None, exit_price=self._safe_decimal(trade.get("exit_price")), exit_time=pd.to_datetime(trade.get("exit_time")) if trade.get("exit_time") else None, # Position details position_size=self._safe_decimal(trade.get("position_size")), direction=trade.get("direction", "long"), # P&L pnl=self._safe_decimal(trade.get("pnl")), pnl_percent=self._safe_decimal(trade.get("pnl_percent")), # Risk metrics mae=self._safe_decimal(trade.get("mae")), mfe=self._safe_decimal(trade.get("mfe")), # Duration duration_days=trade.get("duration_days"), duration_hours=self._safe_decimal(trade.get("duration_hours")), # Exit details exit_reason=trade.get("exit_reason"), fees_paid=self._safe_decimal(trade.get("fees_paid")), slippage_cost=self._safe_decimal(trade.get("slippage_cost")), ) trades.append(trade_record) self.session.add_all(trades) logger.info(f"Saved {len(trades)} trades for backtest {backtest_id}") except Exception as e: logger.error(f"Error saving trades: {e}") raise def get_backtest_by_id(self, backtest_id: str) -> BacktestResult | None: """ Retrieve a backtest by ID. Args: backtest_id: UUID string of the backtest Returns: BacktestResult or None if not found """ try: # Convert string to UUID for database query if isinstance(backtest_id, str): backtest_uuid = UUID(backtest_id) else: backtest_uuid = backtest_id return ( self.session.query(BacktestResult) .filter(BacktestResult.backtest_id == backtest_uuid) .first() ) except SQLAlchemyError as e: logger.error(f"Error retrieving backtest {backtest_id}: {e}") return None except ValueError as e: logger.error(f"Invalid UUID format {backtest_id}: {e}") return None def get_backtests_by_symbol( self, symbol: str, strategy_type: str | None = None, limit: int = 10 ) -> list[BacktestResult]: """ Get backtests for a specific symbol. Args: symbol: Stock symbol strategy_type: Optional strategy filter limit: Maximum number of results Returns: List of BacktestResult objects """ try: query = self.session.query(BacktestResult).filter( BacktestResult.symbol == symbol.upper() ) if strategy_type: query = query.filter(BacktestResult.strategy_type == strategy_type) return query.order_by(desc(BacktestResult.backtest_date)).limit(limit).all() except SQLAlchemyError as e: logger.error(f"Error retrieving backtests for {symbol}: {e}") return [] def get_best_performing_strategies( self, metric: str = "sharpe_ratio", min_trades: int = 10, limit: int = 20 ) -> list[BacktestResult]: """ Get best performing backtests by specified metric. Args: metric: Performance metric (sharpe_ratio, total_return, profit_factor) min_trades: Minimum number of trades required limit: Maximum number of results Returns: List of top performing BacktestResult objects """ try: metric_column = getattr(BacktestResult, metric, BacktestResult.sharpe_ratio) return ( self.session.query(BacktestResult) .filter( BacktestResult.status == "completed", BacktestResult.total_trades >= min_trades, metric_column.isnot(None), ) .order_by(desc(metric_column)) .limit(limit) .all() ) except SQLAlchemyError as e: logger.error(f"Error retrieving best performing strategies: {e}") return [] def compare_strategies( self, backtest_ids: list[str], metrics: list[str] | None = None ) -> dict[str, Any]: """ Compare multiple backtests across specified metrics. Args: backtest_ids: List of backtest UUID strings metrics: List of metrics to compare (default: common metrics) Returns: Dictionary with comparison results """ if not metrics: metrics = [ "total_return", "sharpe_ratio", "max_drawdown", "win_rate", "profit_factor", "total_trades", ] try: # Convert string UUIDs to UUID objects uuid_list = [] for bt_id in backtest_ids: if isinstance(bt_id, str): uuid_list.append(UUID(bt_id)) else: uuid_list.append(bt_id) backtests = ( self.session.query(BacktestResult) .filter(BacktestResult.backtest_id.in_(uuid_list)) .all() ) if not backtests: return {"error": "No backtests found"} comparison = {"backtests": [], "summary": {}, "rankings": {}} # Extract data for each backtest for bt in backtests: bt_data = { "backtest_id": str(bt.backtest_id), "symbol": bt.symbol, "strategy": bt.strategy_type, "date": bt.backtest_date.isoformat(), "metrics": {}, } for metric in metrics: value = getattr(bt, metric, None) bt_data["metrics"][metric] = float(value) if value else None comparison["backtests"].append(bt_data) # Calculate rankings for each metric for metric in metrics: metric_values = [ (bt["backtest_id"], bt["metrics"].get(metric)) for bt in comparison["backtests"] if bt["metrics"].get(metric) is not None ] if metric_values: # Sort by metric value (descending for most metrics) reverse_sort = metric != "max_drawdown" # Lower drawdown is better sorted_values = sorted( metric_values, key=lambda x: x[1], reverse=reverse_sort ) comparison["rankings"][metric] = [ {"backtest_id": bt_id, "value": value, "rank": i + 1} for i, (bt_id, value) in enumerate(sorted_values) ] # Summary statistics comparison["summary"] = { "total_backtests": len(backtests), "date_range": { "earliest": min(bt.backtest_date for bt in backtests).isoformat(), "latest": max(bt.backtest_date for bt in backtests).isoformat(), }, } return comparison except SQLAlchemyError as e: logger.error(f"Error comparing strategies: {e}") return {"error": f"Database error: {e}"} def save_optimization_results( self, backtest_id: str, optimization_results: list[dict[str, Any]], objective_function: str = "sharpe_ratio", ) -> int: """ Save parameter optimization results. Args: backtest_id: Parent backtest UUID optimization_results: List of optimization result dictionaries objective_function: Optimization objective (sharpe_ratio, total_return, etc.) Returns: Number of optimization results saved """ try: # Convert string UUID to UUID object if isinstance(backtest_id, str): backtest_uuid = UUID(backtest_id) else: backtest_uuid = backtest_id optimization_records = [] for i, result in enumerate(optimization_results, 1): record = OptimizationResult( optimization_id=uuid4(), backtest_id=backtest_uuid, parameter_set=i, parameters=result.get("parameters", {}), objective_function=objective_function, objective_value=self._safe_decimal(result.get("objective_value")), total_return=self._safe_decimal(result.get("total_return")), sharpe_ratio=self._safe_decimal(result.get("sharpe_ratio")), max_drawdown=self._safe_decimal(result.get("max_drawdown")), win_rate=self._safe_decimal(result.get("win_rate")), profit_factor=self._safe_decimal(result.get("profit_factor")), total_trades=result.get("total_trades"), rank=result.get("rank", i), is_statistically_significant=result.get( "is_statistically_significant", False ), p_value=self._safe_decimal(result.get("p_value")), ) optimization_records.append(record) self.session.add_all(optimization_records) self.session.commit() logger.info(f"Saved {len(optimization_records)} optimization results") return len(optimization_records) except SQLAlchemyError as e: self.session.rollback() logger.error(f"Error saving optimization results: {e}") raise BacktestPersistenceError(f"Failed to save optimization results: {e}") def save_walk_forward_test( self, parent_backtest_id: str, walk_forward_data: dict[str, Any] ) -> str: """ Save walk-forward validation test results. Args: parent_backtest_id: Parent backtest UUID walk_forward_data: Walk-forward test data Returns: UUID string of saved walk-forward test """ try: # Convert string UUID to UUID object if isinstance(parent_backtest_id, str): parent_uuid = UUID(parent_backtest_id) else: parent_uuid = parent_backtest_id wf_test = WalkForwardTest( walk_forward_id=uuid4(), parent_backtest_id=parent_uuid, window_size_months=walk_forward_data.get("window_size_months"), step_size_months=walk_forward_data.get("step_size_months"), # Time periods training_start=pd.to_datetime( walk_forward_data.get("training_start") ).date(), training_end=pd.to_datetime( walk_forward_data.get("training_end") ).date(), test_period_start=pd.to_datetime( walk_forward_data.get("test_period_start") ).date(), test_period_end=pd.to_datetime( walk_forward_data.get("test_period_end") ).date(), # Results optimal_parameters=walk_forward_data.get("optimal_parameters"), training_performance=self._safe_decimal( walk_forward_data.get("training_performance") ), out_of_sample_return=self._safe_decimal( walk_forward_data.get("out_of_sample_return") ), out_of_sample_sharpe=self._safe_decimal( walk_forward_data.get("out_of_sample_sharpe") ), out_of_sample_drawdown=self._safe_decimal( walk_forward_data.get("out_of_sample_drawdown") ), out_of_sample_trades=walk_forward_data.get("out_of_sample_trades"), # Performance analysis performance_ratio=self._safe_decimal( walk_forward_data.get("performance_ratio") ), degradation_factor=self._safe_decimal( walk_forward_data.get("degradation_factor") ), is_profitable=walk_forward_data.get("is_profitable"), is_statistically_significant=walk_forward_data.get( "is_statistically_significant", False ), ) self.session.add(wf_test) self.session.commit() logger.info(f"Saved walk-forward test: {wf_test.walk_forward_id}") return str(wf_test.walk_forward_id) except SQLAlchemyError as e: self.session.rollback() logger.error(f"Error saving walk-forward test: {e}") raise BacktestPersistenceError(f"Failed to save walk-forward test: {e}") def get_backtest_performance_summary( self, symbol: str | None = None, strategy_type: str | None = None, days_back: int = 30, ) -> dict[str, Any]: """ Get performance summary of recent backtests. Args: symbol: Optional symbol filter strategy_type: Optional strategy filter days_back: Days to look back Returns: Dictionary with performance summary """ try: cutoff_date = datetime.utcnow() - timedelta(days=days_back) query = self.session.query(BacktestResult).filter( BacktestResult.backtest_date >= cutoff_date, BacktestResult.status == "completed", ) if symbol: query = query.filter(BacktestResult.symbol == symbol.upper()) if strategy_type: query = query.filter(BacktestResult.strategy_type == strategy_type) backtests = query.all() if not backtests: return {"message": "No backtests found in the specified period"} # Calculate summary statistics returns = [float(bt.total_return) for bt in backtests if bt.total_return] sharpe_ratios = [ float(bt.sharpe_ratio) for bt in backtests if bt.sharpe_ratio ] win_rates = [float(bt.win_rate) for bt in backtests if bt.win_rate] summary = { "period": f"Last {days_back} days", "total_backtests": len(backtests), "performance_metrics": { "average_return": sum(returns) / len(returns) if returns else 0, "best_return": max(returns) if returns else 0, "worst_return": min(returns) if returns else 0, "average_sharpe": sum(sharpe_ratios) / len(sharpe_ratios) if sharpe_ratios else 0, "average_win_rate": sum(win_rates) / len(win_rates) if win_rates else 0, }, "strategy_breakdown": {}, "symbol_breakdown": {}, } # Group by strategy strategy_groups = {} for bt in backtests: strategy = bt.strategy_type if strategy not in strategy_groups: strategy_groups[strategy] = [] strategy_groups[strategy].append(bt) for strategy, strategy_backtests in strategy_groups.items(): strategy_returns = [ float(bt.total_return) for bt in strategy_backtests if bt.total_return ] summary["strategy_breakdown"][strategy] = { "count": len(strategy_backtests), "average_return": sum(strategy_returns) / len(strategy_returns) if strategy_returns else 0, } # Group by symbol symbol_groups = {} for bt in backtests: symbol = bt.symbol if symbol not in symbol_groups: symbol_groups[symbol] = [] symbol_groups[symbol].append(bt) for symbol, symbol_backtests in symbol_groups.items(): symbol_returns = [ float(bt.total_return) for bt in symbol_backtests if bt.total_return ] summary["symbol_breakdown"][symbol] = { "count": len(symbol_backtests), "average_return": sum(symbol_returns) / len(symbol_returns) if symbol_returns else 0, } return summary except SQLAlchemyError as e: logger.error(f"Error generating performance summary: {e}") return {"error": f"Database error: {e}"} def delete_backtest(self, backtest_id: str) -> bool: """ Delete a backtest and all associated data. Args: backtest_id: UUID string of backtest to delete Returns: True if deleted successfully, False otherwise """ try: # Convert string UUID to UUID object if isinstance(backtest_id, str): backtest_uuid = UUID(backtest_id) else: backtest_uuid = backtest_id backtest = ( self.session.query(BacktestResult) .filter(BacktestResult.backtest_id == backtest_uuid) .first() ) if not backtest: logger.warning(f"Backtest {backtest_id} not found") return False # Delete associated records (cascading should handle this) self.session.delete(backtest) self.session.commit() logger.info(f"Deleted backtest {backtest_id}") return True except SQLAlchemyError as e: self.session.rollback() logger.error(f"Error deleting backtest {backtest_id}: {e}") return False @staticmethod def _safe_decimal(value: Any) -> Decimal | None: """Safely convert value to Decimal, handling None and invalid values.""" if value is None: return None try: if isinstance(value, int | float): return Decimal(str(value)) elif isinstance(value, Decimal): return value else: return Decimal(str(float(value))) except (ValueError, TypeError, InvalidOperation): return None def get_persistence_manager( session: Session | None = None, ) -> BacktestPersistenceManager: """ Factory function to create a persistence manager. Args: session: Optional SQLAlchemy session Returns: BacktestPersistenceManager instance """ return BacktestPersistenceManager(session) # Convenience functions for common operations def save_vectorbt_results( vectorbt_results: dict[str, Any], execution_time: float | None = None, notes: str | None = None, ) -> str: """ Convenience function to save VectorBT results. Args: vectorbt_results: Results from VectorBTEngine execution_time: Execution time in seconds notes: Optional notes Returns: Backtest UUID string """ with get_persistence_manager() as manager: return manager.save_backtest_result(vectorbt_results, execution_time, notes) def get_recent_backtests(symbol: str, days: int = 7) -> list[BacktestResult]: """ Get recent backtests for a symbol. Args: symbol: Stock symbol days: Number of days to look back Returns: List of recent BacktestResult objects """ with get_persistence_manager() as manager: cutoff_date = datetime.utcnow() - timedelta(days=days) return ( manager.session.query(BacktestResult) .filter( BacktestResult.symbol == symbol.upper(), BacktestResult.backtest_date >= cutoff_date, ) .order_by(desc(BacktestResult.backtest_date)) .all() ) def find_best_strategy_for_symbol( symbol: str, metric: str = "sharpe_ratio" ) -> BacktestResult | None: """ Find the best performing strategy for a symbol. Args: symbol: Stock symbol metric: Performance metric to optimize Returns: Best BacktestResult or None """ with get_persistence_manager() as manager: return ( manager.get_best_performing_strategies(metric=metric, limit=1)[0] if manager.get_backtests_by_symbol(symbol, limit=1000) else None )

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/wshobson/maverick-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

persistence.py•28.4 KiB