ms-fabric-mcp-server

pipeline.py•84.5 KiB

# ABOUTME: Service for Fabric pipeline operations. # ABOUTME: Handles pipeline creation and Copy Activity configuration. """Service for Microsoft Fabric pipeline operations.""" import base64 import json import logging from typing import Any, Dict, Optional from urllib.parse import urlencode from ..client.exceptions import (FabricAPIError, FabricError, FabricItemNotFoundError, FabricValidationError) from ..client.http_client import FabricClient from .item import FabricItemService from .workspace import FabricWorkspaceService logger = logging.getLogger(__name__) class FabricPipelineService: """Service for Microsoft Fabric pipeline operations. This service provides high-level operations for creating and managing Fabric Data Factory pipelines, particularly pipelines with Copy Activities for data ingestion from various sources to various destinations. Example: ```python from ms_fabric_mcp_server import FabricConfig, FabricClient from ms_fabric_mcp_server.services import ( FabricPipelineService, FabricWorkspaceService, FabricItemService ) config = FabricConfig.from_environment() client = FabricClient(config) workspace_service = FabricWorkspaceService(client) item_service = FabricItemService(client) pipeline_service = FabricPipelineService(client, workspace_service, item_service) # Create pipeline with Copy Activity pipeline_id = pipeline_service.create_pipeline_with_copy_activity( workspace_id="12345678-1234-1234-1234-123456789abc", pipeline_name="Copy_Data_Pipeline", source_type="AzurePostgreSqlSource", source_connection_id="conn-123", source_schema="public", source_table="movie", destination_lakehouse_id="lakehouse-456", destination_connection_id="dest-conn-123", destination_table="movie" ) ``` """ def __init__( self, client: FabricClient, workspace_service: FabricWorkspaceService, item_service: FabricItemService, ): """Initialize the pipeline service. Args: client: FabricClient instance for API calls workspace_service: Service for workspace operations item_service: Service for item operations """ self.client = client self.workspace_service = workspace_service self.item_service = item_service logger.debug("FabricPipelineService initialized") def create_pipeline_with_copy_activity( self, workspace_id: str, pipeline_name: str, source_type: str, source_connection_id: str, source_schema: str, source_table: str, destination_lakehouse_id: str, destination_connection_id: str, destination_table: str, source_access_mode: str = "direct", source_sql_query: Optional[str] = None, description: Optional[str] = None, table_action_option: str = "Append", apply_v_order: bool = True, timeout: str = "0.12:00:00", retry: int = 0, retry_interval_seconds: int = 30, ) -> str: """Create a Fabric pipeline with a Copy Activity. Creates a Data Pipeline in the specified workspace with a Copy Activity configured to copy data from a source database table to a Fabric Lakehouse table. Args: workspace_id: Workspace ID where pipeline will be created pipeline_name: Name for the new pipeline (must be unique in workspace) source_type: Type of source (e.g., "AzurePostgreSqlSource", "AzureSqlSource", etc.) source_connection_id: Fabric workspace connection ID for source source_schema: Schema name of the source table (e.g., "public") source_table: Name of the source table (e.g., "movie") destination_lakehouse_id: Workspace artifact ID of the destination Lakehouse destination_connection_id: Fabric workspace connection ID for destination destination_table: Name for the destination table in Lakehouse source_access_mode: Source access mode ("direct" or "sql"). Default is "direct". source_sql_query: Optional SQL query for sql access mode. description: Optional description for the pipeline table_action_option: Table action option (default: "Append", options: "Append", "Overwrite") apply_v_order: Apply V-Order optimization (default: True) timeout: Activity timeout (default: "0.12:00:00") retry: Number of retry attempts (default: 0) retry_interval_seconds: Retry interval in seconds (default: 30) Returns: Pipeline ID (GUID) of the created pipeline Raises: FabricValidationError: If parameters are invalid FabricAPIError: If pipeline creation fails FabricError: For other errors Example: ```python pipeline_id = pipeline_service.create_pipeline_with_copy_activity( workspace_id="12345678-1234-1234-1234-123456789abc", pipeline_name="Copy_Movie_Table", source_type="AzurePostgreSqlSource", source_connection_id="conn-123", source_schema="public", source_table="movie", destination_lakehouse_id="lakehouse-456", destination_connection_id="dest-conn-123", destination_table="movie", description="Copy movie data from PostgreSQL to Bronze Lakehouse" ) ``` """ logger.info( f"Creating pipeline '{pipeline_name}' with Copy Activity in workspace {workspace_id}" ) # Validate inputs self._validate_pipeline_inputs( pipeline_name, source_type, source_connection_id, source_schema, source_table, destination_lakehouse_id, destination_connection_id, destination_table, ) source_access_mode = ( source_access_mode.lower().strip() if source_access_mode else "" ) self._validate_source_access_mode(source_access_mode, source_sql_query) try: # Build pipeline definition pipeline_definition = self._build_copy_activity_definition( workspace_id, source_type, source_connection_id, source_schema, source_table, destination_lakehouse_id, destination_connection_id, destination_table, table_action_option, apply_v_order, timeout, retry, retry_interval_seconds, source_access_mode=source_access_mode, source_sql_query=source_sql_query, ) # Encode definition to Base64 encoded_definition = self._encode_definition(pipeline_definition) # Create item definition for API item_definition = { "displayName": pipeline_name, "type": "DataPipeline", "definition": { "parts": [ { "path": "pipeline-content.json", "payload": encoded_definition, "payloadType": "InlineBase64", } ] }, } if description: item_definition["description"] = description # Create the pipeline item created_item = self.item_service.create_item(workspace_id, item_definition) logger.info(f"Successfully created pipeline with ID: {created_item.id}") return created_item.id except FabricValidationError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to create pipeline: {exc}") raise FabricError(f"Failed to create pipeline: {exc}") def _validate_pipeline_inputs( self, pipeline_name: str, source_type: str, source_connection_id: str, source_schema: str, source_table: str, destination_lakehouse_id: str, destination_connection_id: str, destination_table: str, ) -> None: """Validate pipeline creation inputs. Args: pipeline_name: Pipeline name source_type: Source type source_connection_id: Source connection ID source_schema: Source schema name source_table: Source table name destination_lakehouse_id: Destination lakehouse ID destination_connection_id: Destination connection ID destination_table: Destination table name Raises: FabricValidationError: If any input is invalid """ if not pipeline_name or not pipeline_name.strip(): raise FabricValidationError( "pipeline_name", "empty", "Pipeline name cannot be empty" ) if not source_type or not source_type.strip(): raise FabricValidationError( "source_type", "empty", "Source type cannot be empty" ) if not source_connection_id or not source_connection_id.strip(): raise FabricValidationError( "source_connection_id", "empty", "Source connection ID cannot be empty" ) if not source_schema or not source_schema.strip(): raise FabricValidationError( "source_schema", "empty", "Source schema cannot be empty" ) if not source_table or not source_table.strip(): raise FabricValidationError( "source_table", "empty", "Source table cannot be empty" ) if not destination_lakehouse_id or not destination_lakehouse_id.strip(): raise FabricValidationError( "destination_lakehouse_id", "empty", "Destination lakehouse ID cannot be empty", ) if not destination_connection_id or not destination_connection_id.strip(): raise FabricValidationError( "destination_connection_id", "empty", "Destination connection ID cannot be empty", ) if not destination_table or not destination_table.strip(): raise FabricValidationError( "destination_table", "empty", "Destination table cannot be empty" ) def _build_copy_activity_definition( self, workspace_id: str, source_type: str, source_connection_id: str, source_schema: str, source_table: str, destination_lakehouse_id: str, destination_connection_id: str, destination_table: str, table_action_option: str, apply_v_order: bool, timeout: str, retry: int, retry_interval_seconds: int, source_access_mode: str = "direct", source_sql_query: Optional[str] = None, ) -> Dict[str, Any]: """Build the pipeline JSON structure with Copy Activity. Creates a complete Fabric pipeline definition with a Copy Activity that copies data from a source database to Lakehouse. Args: workspace_id: Workspace ID where pipeline will be created source_type: Type of source (e.g., "AzurePostgreSqlSource") source_connection_id: Fabric workspace connection ID for source source_schema: Source table schema name source_table: Source table name destination_lakehouse_id: Destination lakehouse ID destination_connection_id: Destination connection ID destination_table: Destination table name table_action_option: Table action option (e.g., "Append", "Overwrite") apply_v_order: Apply V-Order optimization timeout: Activity timeout retry: Number of retry attempts retry_interval_seconds: Retry interval in seconds source_access_mode: Source access mode ("direct" or "sql") source_sql_query: Optional SQL query for sql access mode Returns: Pipeline definition dictionary ready for encoding """ logger.debug("Building Copy Activity definition") copy_activity = self._build_copy_activity( workspace_id=workspace_id, source_type=source_type, source_connection_id=source_connection_id, source_schema=source_schema, source_table=source_table, destination_lakehouse_id=destination_lakehouse_id, destination_connection_id=destination_connection_id, destination_table=destination_table, table_action_option=table_action_option, apply_v_order=apply_v_order, timeout=timeout, retry=retry, retry_interval_seconds=retry_interval_seconds, source_access_mode=source_access_mode, source_sql_query=source_sql_query, ) definition = {"properties": {"activities": [copy_activity], "annotations": []}} logger.debug("Copy Activity definition built successfully") return definition def _get_source_dataset_type(self, source_type: str) -> str: """Map source type to dataset type. Args: source_type: Source type (e.g., "AzurePostgreSqlSource") Returns: Dataset type (e.g., "AzurePostgreSqlTable") """ # Map common source types to dataset types type_mapping = { "AzurePostgreSqlSource": "AzurePostgreSqlTable", "AzureSqlSource": "AzureSqlTable", "SqlServerSource": "SqlServerTable", "MySqlSource": "MySqlTable", "OracleSource": "OracleTable", "LakehouseTableSource": "LakehouseTable", } # Try to get the dataset type from mapping, or derive it if source_type in type_mapping: return type_mapping[source_type] # Default derivation: replace "Source" with "Table" if source_type.endswith("Source"): return source_type.replace("Source", "Table") # Fallback: return as-is to allow newer/unknown source types return source_type def _validate_source_access_mode( self, source_access_mode: str, source_sql_query: Optional[str], ) -> None: if not source_access_mode: raise FabricValidationError( "source_access_mode", source_access_mode, "Source access mode cannot be empty", ) if source_access_mode not in {"direct", "sql"}: raise FabricValidationError( "source_access_mode", source_access_mode, "Source access mode must be 'direct' or 'sql'", ) if source_sql_query and source_access_mode != "sql": raise FabricValidationError( "source_sql_query", source_sql_query, "source_sql_query requires source_access_mode='sql'", ) def _resolve_source_type(self, source_type: str, source_access_mode: str) -> str: if source_access_mode == "sql": return "AzureSqlSource" return source_type def _build_copy_activity( self, workspace_id: str, source_type: str, source_connection_id: str, source_schema: str, source_table: str, destination_lakehouse_id: str, destination_connection_id: str, destination_table: str, table_action_option: str, apply_v_order: bool, timeout: str, retry: int, retry_interval_seconds: int, source_access_mode: str = "direct", source_sql_query: Optional[str] = None, ) -> Dict[str, Any]: effective_source_type = self._resolve_source_type( source_type, source_access_mode ) source_dataset_type = self._get_source_dataset_type(effective_source_type) include_schema = not ( source_access_mode == "direct" and source_type == "LakehouseTableSource" ) source_type_properties: Dict[str, Any] = {"table": source_table} if include_schema: source_type_properties["schema"] = source_schema source_settings: Dict[str, Any] = { "type": effective_source_type, "partitionOption": "None", "queryTimeout": "02:00:00", "datasetSettings": { "annotations": [], "type": source_dataset_type, "schema": [], "typeProperties": source_type_properties, "version": "2.0", "externalReferences": {"connection": source_connection_id}, }, } if source_access_mode == "sql" and source_sql_query: source_settings["sqlReaderQuery"] = source_sql_query copy_activity = { "name": "CopyDataToLakehouse", "type": "Copy", "dependsOn": [], "policy": { "timeout": timeout, "retry": retry, "retryIntervalInSeconds": retry_interval_seconds, "secureOutput": False, "secureInput": False, }, "typeProperties": { "source": source_settings, "sink": { "type": "LakehouseTableSink", "tableActionOption": table_action_option, "applyVOrder": apply_v_order, "datasetSettings": { "annotations": [], "connectionSettings": { "name": "DestinationLakehouse", "properties": { "annotations": [], "type": "Lakehouse", "typeProperties": { "workspaceId": workspace_id, "artifactId": destination_lakehouse_id, "rootFolder": "Tables", }, "externalReferences": { "connection": destination_connection_id }, }, }, "type": "LakehouseTable", "schema": [], "typeProperties": {"schema": "dbo", "table": destination_table}, }, }, "enableStaging": False, "translator": { "type": "TabularTranslator", "typeConversion": True, "typeConversionSettings": { "allowDataTruncation": True, "treatBooleanAsNumber": False, }, }, }, } return copy_activity def _encode_definition(self, definition: Dict[str, Any]) -> str: """Encode pipeline definition to Base64 for API submission. Args: definition: Pipeline definition dictionary Returns: Base64-encoded JSON string Raises: FabricError: If encoding fails """ try: # Convert to JSON string json_str = json.dumps(definition, indent=2) # Encode to Base64 encoded = base64.b64encode(json_str.encode("utf-8")).decode("utf-8") logger.debug( f"Pipeline definition encoded: {len(encoded)} base64 characters" ) return encoded except Exception as exc: logger.error(f"Failed to encode pipeline definition: {exc}") raise FabricError(f"Failed to encode pipeline definition: {exc}") def _decode_definition(self, encoded_definition: str) -> Dict[str, Any]: """Decode Base64-encoded pipeline definition. Args: encoded_definition: Base64-encoded JSON string Returns: Pipeline definition dictionary Raises: FabricError: If decoding fails """ try: # Decode from Base64 decoded_bytes = base64.b64decode(encoded_definition) # Convert to dictionary definition = json.loads(decoded_bytes.decode("utf-8")) logger.debug("Pipeline definition decoded successfully") return definition except Exception as exc: logger.error(f"Failed to decode pipeline definition: {exc}") raise FabricError(f"Failed to decode pipeline definition: {exc}") def _decode_base64_payload(self, payload: str) -> str: """Decode a Base64 payload to a UTF-8 string.""" try: return base64.b64decode(payload).decode("utf-8") except Exception as exc: logger.error(f"Failed to decode base64 payload: {exc}") raise FabricError(f"Failed to decode base64 payload: {exc}") def _build_endpoint( self, base: str, params: Optional[Dict[str, str]] = None ) -> str: if params: return f"{base}?{urlencode(params)}" return base def _validate_pipeline_definition_inputs( self, workspace_id: str, pipeline_id: str ) -> None: if not workspace_id or not str(workspace_id).strip(): raise FabricValidationError( "workspace_id", str(workspace_id), "Workspace ID cannot be empty", ) if not pipeline_id or not str(pipeline_id).strip(): raise FabricValidationError( "pipeline_id", str(pipeline_id), "Pipeline ID cannot be empty", ) def create_blank_pipeline( self, workspace_id: str, pipeline_name: str, description: Optional[str] = None, folder_id: Optional[str] = None, folder_path: Optional[str] = None, ) -> str: """Create a blank Fabric pipeline with no activities. Creates a Data Pipeline in the specified workspace with an empty activities array, ready to be populated with activities later. Args: workspace_id: Workspace ID where pipeline will be created pipeline_name: Name for the new pipeline (must be unique in workspace) description: Optional description for the pipeline folder_id: Optional folder ID to place the pipeline in folder_path: Optional folder path to place the pipeline in Returns: Pipeline ID (GUID) of the created pipeline Raises: FabricValidationError: If parameters are invalid FabricAPIError: If pipeline creation fails FabricError: For other errors Example: ```python pipeline_id = pipeline_service.create_blank_pipeline( workspace_id="12345678-1234-1234-1234-123456789abc", pipeline_name="My_New_Pipeline", description="A blank pipeline to be configured later" ) ``` """ logger.info( f"Creating blank pipeline '{pipeline_name}' in workspace {workspace_id}" ) # Validate inputs if not pipeline_name or not pipeline_name.strip(): raise FabricValidationError( "pipeline_name", "empty", "Pipeline name cannot be empty" ) if "/" in pipeline_name or "\\" in pipeline_name: raise FabricValidationError( "pipeline_name", pipeline_name, "Pipeline name cannot include path separators. Use folder_path instead.", ) if folder_id and folder_path: raise FabricValidationError( "folder_path", folder_path, "Provide either folder_id or folder_path, not both.", ) try: if folder_path: folder_id = self.item_service.resolve_folder_id_from_path( workspace_id, folder_path, create_missing=True ) # Build blank pipeline definition pipeline_definition = {"properties": {"activities": [], "annotations": []}} # Encode definition to Base64 encoded_definition = self._encode_definition(pipeline_definition) # Create item definition for API item_definition = { "displayName": pipeline_name, "type": "DataPipeline", "definition": { "parts": [ { "path": "pipeline-content.json", "payload": encoded_definition, "payloadType": "InlineBase64", } ] }, } if folder_id: item_definition["folderId"] = folder_id if description: item_definition["description"] = description # Create the pipeline item created_item = self.item_service.create_item(workspace_id, item_definition) logger.info( f"Successfully created blank pipeline with ID: {created_item.id}" ) return created_item.id except FabricValidationError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to create blank pipeline: {exc}") raise FabricError(f"Failed to create blank pipeline: {exc}") def create_pipeline_with_definition( self, workspace_id: str, display_name: str, pipeline_content_json: Dict[str, Any], platform: Optional[Dict[str, Any]] = None, description: Optional[str] = None, folder_id: Optional[str] = None, folder_path: Optional[str] = None, ) -> str: """Create a data pipeline using a supplied definition.""" logger.info( f"Creating pipeline '{display_name}' with definition in workspace {workspace_id}" ) if not display_name or not display_name.strip(): raise FabricValidationError( "display_name", "empty", "Display name cannot be empty", ) if "/" in display_name or "\\" in display_name: raise FabricValidationError( "display_name", display_name, "Display name cannot include path separators. Use folder_path instead.", ) if not isinstance(pipeline_content_json, dict): raise FabricValidationError( "pipeline_content_json", str(type(pipeline_content_json)), "pipeline_content_json must be a dictionary", ) if platform is not None and not isinstance(platform, dict): raise FabricValidationError( "platform", str(type(platform)), "platform must be a dictionary when provided", ) if folder_id and folder_path: raise FabricValidationError( "folder_path", folder_path, "Provide either folder_id or folder_path, not both.", ) try: if folder_path: folder_id = self.item_service.resolve_folder_id_from_path( workspace_id, folder_path, create_missing=True ) parts = [ { "path": "pipeline-content.json", "payload": self._encode_definition(pipeline_content_json), "payloadType": "InlineBase64", } ] if platform is not None: parts.append( { "path": ".platform", "payload": self._encode_definition(platform), "payloadType": "InlineBase64", } ) payload: Dict[str, Any] = { "displayName": display_name, "definition": {"parts": parts}, } if description: payload["description"] = description if folder_id: payload["folderId"] = folder_id response = self.client.make_api_request( "POST", f"workspaces/{workspace_id}/dataPipelines", payload=payload, wait_for_lro=True, ) if response.status_code not in (200, 201, 202): raise FabricAPIError( response.status_code, "Unexpected response status for pipeline creation", ) response_data = response.json() if not isinstance(response_data, dict) or not response_data: raise FabricError("Failed to create pipeline: empty response") pipeline_id = response_data.get("id") if not pipeline_id: raise FabricError("Failed to create pipeline: missing id in response") logger.info(f"Successfully created pipeline with ID: {pipeline_id}") return pipeline_id except FabricValidationError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to create pipeline with definition: {exc}") raise FabricError(f"Failed to create pipeline with definition: {exc}") def get_pipeline_definition( self, workspace_id: str, pipeline_id: str, format: Optional[str] = None, ) -> Dict[str, Any]: """Get a DataPipeline definition using the DataPipeline-specific API.""" logger.info( f"Fetching pipeline definition for pipeline '{pipeline_id}' in workspace {workspace_id}" ) self._validate_pipeline_definition_inputs(workspace_id, pipeline_id) try: params: Dict[str, str] = {} if format: params["format"] = format endpoint = self._build_endpoint( f"workspaces/{workspace_id}/dataPipelines/{pipeline_id}/getDefinition", params if params else None, ) response = self.client.make_api_request( "POST", endpoint, wait_for_lro=True, ) definition = response.json() if not isinstance(definition, dict): raise FabricError("Failed to fetch pipeline definition: empty response") parts = definition.get("definition", {}).get("parts", []) pipeline_content_part = None platform_part = None for part in parts: path = part.get("path") if path == "pipeline-content.json": pipeline_content_part = part elif path == ".platform": platform_part = part if not pipeline_content_part: raise FabricError( "Pipeline definition missing pipeline-content.json part" ) pipeline_content_payload = pipeline_content_part.get("payload", "") pipeline_content_json = self._decode_definition(pipeline_content_payload) platform = None if platform_part: platform_payload = platform_part.get("payload", "") if platform_payload: decoded_platform = self._decode_base64_payload(platform_payload) try: platform = json.loads(decoded_platform) except Exception: platform = decoded_platform return { "pipeline_content_json": pipeline_content_json, "platform": platform, } except FabricValidationError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to fetch pipeline definition: {exc}") raise FabricError(f"Failed to fetch pipeline definition: {exc}") def update_pipeline_definition( self, workspace_id: str, pipeline_id: str, pipeline_content_json: Dict[str, Any], platform: Optional[Dict[str, Any]] = None, update_metadata: bool = False, ) -> None: """Update a DataPipeline definition using the DataPipeline-specific API.""" logger.info( f"Updating pipeline definition for pipeline '{pipeline_id}' in workspace {workspace_id}" ) self._validate_pipeline_definition_inputs(workspace_id, pipeline_id) if not isinstance(pipeline_content_json, dict): raise FabricValidationError( "pipeline_content_json", str(type(pipeline_content_json)), "pipeline_content_json must be a dictionary", ) if platform is not None and not isinstance(platform, dict): raise FabricValidationError( "platform", str(type(platform)), "platform must be a dictionary when provided", ) if update_metadata is True and platform is None: raise FabricValidationError( "update_metadata", str(update_metadata), "update_metadata requires platform to be provided", ) try: parts = [ { "path": "pipeline-content.json", "payload": self._encode_definition(pipeline_content_json), "payloadType": "InlineBase64", } ] if platform is not None: parts.append( { "path": ".platform", "payload": self._encode_definition(platform), "payloadType": "InlineBase64", } ) payload = {"definition": {"parts": parts}} params: Dict[str, str] = {} if update_metadata: params["updateMetadata"] = "true" endpoint = self._build_endpoint( f"workspaces/{workspace_id}/dataPipelines/{pipeline_id}/updateDefinition", params if params else None, ) self.client.make_api_request( "POST", endpoint, payload=payload, wait_for_lro=True, ) except FabricValidationError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to update pipeline definition: {exc}") raise FabricError(f"Failed to update pipeline definition: {exc}") def set_activity_dependency( self, workspace_id: str, pipeline_name: str, activity_name: str, depends_on: list[str], mode: str = "add", dependency_conditions: Optional[list[str]] = None, ) -> tuple[str, int]: """Add, remove, or replace dependencies for an activity.""" logger.info( f"Setting dependencies for activity '{activity_name}' in pipeline '{pipeline_name}' " f"(mode={mode})" ) self._validate_activity_operation_inputs( workspace_id, pipeline_name, activity_name ) if depends_on is None: depends_on = [] if not isinstance(depends_on, list): raise FabricValidationError( "depends_on", str(type(depends_on)), "depends_on must be a list of activity names", ) mode = (mode or "").strip().lower() if mode not in {"add", "remove", "replace"}: raise FabricValidationError( "mode", mode, "mode must be one of: add, remove, replace", ) if mode in {"add", "remove"} and not depends_on: raise FabricValidationError( "depends_on", "empty", f"depends_on must not be empty when mode='{mode}'", ) if dependency_conditions is None: dependency_conditions = ["Succeeded"] if mode != "remove": if not isinstance(dependency_conditions, list) or not dependency_conditions: raise FabricValidationError( "dependency_conditions", str(dependency_conditions), "dependency_conditions must be a non-empty list", ) try: pipeline = self.item_service.get_item_by_name( workspace_id, pipeline_name, "DataPipeline" ) definition_result = self.get_pipeline_definition( workspace_id=workspace_id, pipeline_id=pipeline.id, ) definition = definition_result["pipeline_content_json"] platform = definition_result.get("platform") platform_payload = platform if isinstance(platform, dict) else None activities = self._get_pipeline_activities(definition) existing_names = { activity.get("name") for activity in activities if activity.get("name") } target = next( ( activity for activity in activities if activity.get("name") == activity_name ), None, ) if not target: raise FabricValidationError( "activity_name", activity_name, "Activity not found in pipeline", ) for dep in depends_on: if dep == activity_name: raise FabricValidationError( "depends_on", dep, "Activity cannot depend on itself", ) if dep not in existing_names: raise FabricValidationError( "depends_on", dep, "Dependency activity not found in pipeline", ) current_depends = target.get("dependsOn") if not isinstance(current_depends, list): current_depends = [] current_by_name = { dependency.get("activity"): dependency for dependency in current_depends if dependency.get("activity") } changed_count = 0 if mode == "add": for dep in depends_on: if dep in current_by_name: continue current_depends.append( { "activity": dep, "dependencyConditions": dependency_conditions, } ) changed_count += 1 target["dependsOn"] = current_depends elif mode == "remove": remove_set = set(depends_on) original_len = len(current_depends) current_depends = [ dependency for dependency in current_depends if dependency.get("activity") not in remove_set ] target["dependsOn"] = current_depends changed_count = original_len - len(current_depends) if changed_count == 0: raise FabricValidationError( "depends_on", depends_on, "No dependencies were removed", ) else: target["dependsOn"] = [ { "activity": dep, "dependencyConditions": dependency_conditions, } for dep in depends_on ] changed_count = len(target["dependsOn"]) self.update_pipeline_definition( workspace_id=workspace_id, pipeline_id=pipeline.id, pipeline_content_json=definition, platform=platform_payload, update_metadata=False, ) logger.info( f"Updated dependencies for activity '{activity_name}' in pipeline {pipeline.id}" ) return pipeline.id, changed_count except FabricValidationError: raise except FabricItemNotFoundError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to set activity dependency: {exc}") raise FabricError(f"Failed to set activity dependency: {exc}") def add_copy_activity_to_pipeline( self, workspace_id: str, pipeline_name: str, source_type: str, source_connection_id: str, source_schema: str, source_table: str, destination_lakehouse_id: str, destination_connection_id: str, destination_table: str, activity_name: Optional[str] = None, source_access_mode: str = "direct", source_sql_query: Optional[str] = None, table_action_option: str = "Append", apply_v_order: bool = True, timeout: str = "0.12:00:00", retry: int = 0, retry_interval_seconds: int = 30, ) -> str: """Add a Copy Activity to an existing pipeline. Retrieves an existing pipeline, adds a Copy Activity to it, and updates the pipeline definition. The Copy Activity will be appended to any existing activities. Args: workspace_id: Workspace ID containing the pipeline pipeline_name: Name of the existing pipeline source_type: Type of source (e.g., "AzurePostgreSqlSource", "AzureSqlSource", etc.) source_connection_id: Fabric workspace connection ID for source source_schema: Schema name of the source table (e.g., "public") source_table: Name of the source table (e.g., "movie") destination_lakehouse_id: Workspace artifact ID of the destination Lakehouse destination_connection_id: Fabric workspace connection ID for destination destination_table: Name for the destination table in Lakehouse activity_name: Optional custom name for the activity (default: "CopyDataToLakehouse_{table}") source_access_mode: Source access mode ("direct" or "sql"). Default is "direct". source_sql_query: Optional SQL query for sql access mode. table_action_option: Table action option (default: "Append", options: "Append", "Overwrite") apply_v_order: Apply V-Order optimization (default: True) timeout: Activity timeout (default: "0.12:00:00") retry: Number of retry attempts (default: 0) retry_interval_seconds: Retry interval in seconds (default: 30) Returns: Pipeline ID (GUID) of the updated pipeline Raises: FabricValidationError: If parameters are invalid FabricItemNotFoundError: If pipeline not found FabricAPIError: If pipeline update fails FabricError: For other errors Example: ```python pipeline_id = pipeline_service.add_copy_activity_to_pipeline( workspace_id="12345678-1234-1234-1234-123456789abc", pipeline_name="My_Existing_Pipeline", source_type="AzurePostgreSqlSource", source_connection_id="conn-123", source_schema="public", source_table="movie", destination_lakehouse_id="lakehouse-456", destination_connection_id="dest-conn-123", destination_table="movie", activity_name="CopyMovieData" ) ``` """ logger.info( f"Adding Copy Activity to pipeline '{pipeline_name}' in workspace {workspace_id}" ) # Validate inputs self._validate_pipeline_inputs( pipeline_name, source_type, source_connection_id, source_schema, source_table, destination_lakehouse_id, destination_connection_id, destination_table, ) source_access_mode = ( source_access_mode.lower().strip() if source_access_mode else "" ) self._validate_source_access_mode(source_access_mode, source_sql_query) try: # Get existing pipeline pipeline = self.item_service.get_item_by_name( workspace_id, pipeline_name, "DataPipeline" ) # Get pipeline definition definition_response = self.item_service.get_item_definition( workspace_id, pipeline.id ) # Extract and decode the pipeline content parts = definition_response.get("definition", {}).get("parts", []) pipeline_content_part = None for part in parts: if part.get("path") == "pipeline-content.json": pipeline_content_part = part break if not pipeline_content_part: raise FabricError( "Pipeline definition missing pipeline-content.json part" ) # Decode the existing definition encoded_payload = pipeline_content_part.get("payload", "") existing_definition = self._decode_definition(encoded_payload) # Generate activity name if not provided if not activity_name: activity_name = f"CopyDataToLakehouse_{destination_table}" copy_activity = self._build_copy_activity( workspace_id=workspace_id, source_type=source_type, source_connection_id=source_connection_id, source_schema=source_schema, source_table=source_table, destination_lakehouse_id=destination_lakehouse_id, destination_connection_id=destination_connection_id, destination_table=destination_table, table_action_option=table_action_option, apply_v_order=apply_v_order, timeout=timeout, retry=retry, retry_interval_seconds=retry_interval_seconds, source_access_mode=source_access_mode, source_sql_query=source_sql_query, ) copy_activity["name"] = activity_name # Add the Copy Activity to existing activities if "properties" not in existing_definition: existing_definition["properties"] = {} if "activities" not in existing_definition["properties"]: existing_definition["properties"]["activities"] = [] existing_definition["properties"]["activities"].append(copy_activity) # Encode updated definition encoded_definition = self._encode_definition(existing_definition) # Update the pipeline using updateDefinition endpoint update_payload = { "definition": { "parts": [ { "path": "pipeline-content.json", "payload": encoded_definition, "payloadType": "InlineBase64", } ] } } self.client.make_api_request( "POST", f"workspaces/{workspace_id}/items/{pipeline.id}/updateDefinition", payload=update_payload, ) logger.info( f"Successfully added Copy Activity '{activity_name}' to pipeline {pipeline.id}" ) return pipeline.id except FabricValidationError: raise except FabricItemNotFoundError: raise except FabricAPIError as exc: if ( source_access_mode == "sql" and "SqlAnalyticsEndpoint" in str(exc) ): raise FabricValidationError( "source_connection_id", source_connection_id, "SQL copy mode requires a Lakehouse connection ID. " "SQL analytics endpoint connections are not supported.", ) raise except Exception as exc: logger.error(f"Failed to add Copy Activity to pipeline: {exc}") raise FabricError(f"Failed to add Copy Activity to pipeline: {exc}") def add_notebook_activity_to_pipeline( self, workspace_id: str, pipeline_name: str, notebook_name: str, activity_name: Optional[str] = None, notebook_workspace_id: Optional[str] = None, depends_on_activity_name: Optional[str] = None, session_tag: Optional[str] = None, parameters: Optional[Dict[str, Any]] = None, timeout: str = "0.12:00:00", retry: int = 0, retry_interval_seconds: int = 30, ) -> str: """Add a Notebook Activity to an existing pipeline. Retrieves an existing pipeline, adds a Notebook Activity to it, and updates the pipeline definition. The Notebook Activity will be appended to any existing activities. Args: workspace_id: Workspace ID containing the pipeline pipeline_name: Name of the existing pipeline notebook_name: Name of the notebook to add activity_name: Name for the notebook activity notebook_workspace_id: Workspace ID containing the notebook (optional). Defaults to pipeline workspace. depends_on_activity_name: Optional name of an existing activity this one depends on session_tag: Optional session tag for the notebook execution parameters: Optional parameters to pass to the notebook timeout: Activity timeout (default: "0.12:00:00") retry: Number of retry attempts (default: 0) retry_interval_seconds: Retry interval in seconds (default: 30) Returns: Pipeline ID (GUID) of the updated pipeline """ logger.info( f"Adding Notebook Activity to pipeline '{pipeline_name}' in workspace {workspace_id}" ) activity_name = activity_name or f"RunNotebook_{notebook_name}" notebook_workspace_id = notebook_workspace_id or workspace_id self._validate_notebook_activity_inputs( workspace_id, pipeline_name, notebook_name, activity_name ) try: pipeline, definition = self._get_pipeline_definition( workspace_id, pipeline_name ) notebook = self.item_service.get_item_by_name( notebook_workspace_id, notebook_name, "Notebook" ) type_properties = { "notebookId": notebook.id, "workspaceId": notebook_workspace_id, "parameters": parameters or {}, } if session_tag is not None: type_properties["sessionTag"] = session_tag activity = { "name": activity_name, "type": "TridentNotebook", "dependsOn": [], "policy": { "timeout": timeout, "retry": retry, "retryIntervalInSeconds": retry_interval_seconds, "secureOutput": False, "secureInput": False, }, "typeProperties": type_properties, } self._append_activity_to_definition( definition, activity, depends_on_activity_name ) self._update_pipeline_definition(workspace_id, pipeline.id, definition) logger.info( f"Successfully added Notebook Activity '{activity_name}' to pipeline {pipeline.id}" ) return pipeline.id except FabricValidationError: raise except FabricItemNotFoundError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to add Notebook Activity to pipeline: {exc}") raise FabricError(f"Failed to add Notebook Activity to pipeline: {exc}") def add_dataflow_activity_to_pipeline( self, workspace_id: str, pipeline_name: str, dataflow_name: str, activity_name: Optional[str] = None, dataflow_workspace_id: Optional[str] = None, depends_on_activity_name: Optional[str] = None, timeout: str = "0.12:00:00", retry: int = 0, retry_interval_seconds: int = 30, ) -> str: """Add a Dataflow Activity to an existing pipeline. Retrieves an existing pipeline, adds a Dataflow Activity to it, and updates the pipeline definition. The Dataflow Activity will be appended to any existing activities. Args: workspace_id: Workspace ID containing the pipeline pipeline_name: Name of the existing pipeline dataflow_name: Name of the dataflow to add activity_name: Name for the dataflow activity dataflow_workspace_id: Workspace ID containing the dataflow (optional). Defaults to pipeline workspace. depends_on_activity_name: Optional name of an existing activity this one depends on timeout: Activity timeout (default: "0.12:00:00") retry: Number of retry attempts (default: 0) retry_interval_seconds: Retry interval in seconds (default: 30) Returns: Pipeline ID (GUID) of the updated pipeline """ logger.info( f"Adding Dataflow Activity to pipeline '{pipeline_name}' in workspace {workspace_id}" ) activity_name = activity_name or f"RunDataflow_{dataflow_name}" dataflow_workspace_id = dataflow_workspace_id or workspace_id self._validate_dataflow_activity_inputs( workspace_id, pipeline_name, dataflow_name, activity_name ) try: pipeline, definition = self._get_pipeline_definition( workspace_id, pipeline_name ) dataflow = self.item_service.get_item_by_name( dataflow_workspace_id, dataflow_name, "Dataflow" ) activity = { "name": activity_name, "type": "RefreshDataflow", "dependsOn": [], "policy": { "timeout": timeout, "retry": retry, "retryIntervalInSeconds": retry_interval_seconds, "secureOutput": False, "secureInput": False, }, "typeProperties": { "dataflowId": dataflow.id, "workspaceId": dataflow_workspace_id, "notifyOption": "NoNotification", "dataflowType": "Dataflow-Gen2", }, } self._append_activity_to_definition( definition, activity, depends_on_activity_name ) self._update_pipeline_definition(workspace_id, pipeline.id, definition) logger.info( f"Successfully added Dataflow Activity '{activity_name}' to pipeline {pipeline.id}" ) return pipeline.id except FabricValidationError: raise except FabricItemNotFoundError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to add Dataflow Activity to pipeline: {exc}") raise FabricError(f"Failed to add Dataflow Activity to pipeline: {exc}") def add_activity_from_json( self, workspace_id: str, pipeline_name: str, activity_json: Dict[str, Any] ) -> str: """Add a generic activity to an existing pipeline from a JSON template. Retrieves an existing pipeline, adds an activity from the provided JSON template, and updates the pipeline definition. The activity will be appended to any existing activities. This is a more general-purpose method compared to add_copy_activity_to_pipeline, allowing you to add any type of Fabric pipeline activity by providing its JSON definition. Args: workspace_id: Workspace ID containing the pipeline pipeline_name: Name of the existing pipeline activity_json: JSON dictionary representing the complete activity definition. Must include "name", "type", and all required properties for the activity type. Example: { "name": "MyActivity", "type": "Copy", "dependsOn": [], "policy": {...}, "typeProperties": {...} } Returns: Pipeline ID (GUID) of the updated pipeline Raises: FabricValidationError: If activity_json is invalid or missing required fields FabricItemNotFoundError: If pipeline not found FabricAPIError: If pipeline update fails FabricError: For other errors Example: ```python # Define a Copy Activity as JSON copy_activity = { "name": "CopyCustomData", "type": "Copy", "dependsOn": [], "policy": { "timeout": "0.12:00:00", "retry": 0, "retryIntervalInSeconds": 30, "secureOutput": False, "secureInput": False }, "typeProperties": { "source": { "type": "AzurePostgreSqlSource", "queryTimeout": "02:00:00", "datasetSettings": {...} }, "sink": { "type": "LakehouseTableSink", "tableActionOption": "Append", "datasetSettings": {...} } } } pipeline_id = pipeline_service.add_activity_from_json( workspace_id="12345678-1234-1234-1234-123456789abc", pipeline_name="My_Existing_Pipeline", activity_json=copy_activity ) ``` """ logger.info( f"Adding activity from JSON to pipeline '{pipeline_name}' in workspace {workspace_id}" ) # Validate activity JSON structure if not isinstance(activity_json, dict): raise FabricValidationError( "activity_json", "invalid_type", "activity_json must be a dictionary" ) if "name" not in activity_json or not activity_json["name"]: raise FabricValidationError( "activity_json", "missing_name", "activity_json must include a 'name' field", ) if "type" not in activity_json or not activity_json["type"]: raise FabricValidationError( "activity_json", "missing_type", "activity_json must include a 'type' field", ) activity_name = activity_json.get("name", "UnnamedActivity") activity_type = activity_json.get("type", "Unknown") try: # Get existing pipeline pipeline = self.item_service.get_item_by_name( workspace_id, pipeline_name, "DataPipeline" ) # Get pipeline definition definition_response = self.item_service.get_item_definition( workspace_id, pipeline.id ) # Extract and decode the pipeline content parts = definition_response.get("definition", {}).get("parts", []) pipeline_content_part = None for part in parts: if part.get("path") == "pipeline-content.json": pipeline_content_part = part break if not pipeline_content_part: raise FabricError( "Pipeline definition missing pipeline-content.json part" ) # Decode the existing definition encoded_payload = pipeline_content_part.get("payload", "") existing_definition = self._decode_definition(encoded_payload) # Add the activity to existing activities if "properties" not in existing_definition: existing_definition["properties"] = {} if "activities" not in existing_definition["properties"]: existing_definition["properties"]["activities"] = [] # Append the activity from JSON existing_definition["properties"]["activities"].append(activity_json) # Encode updated definition encoded_definition = self._encode_definition(existing_definition) # Update the pipeline using updateDefinition endpoint update_payload = { "definition": { "parts": [ { "path": "pipeline-content.json", "payload": encoded_definition, "payloadType": "InlineBase64", } ] } } self.client.make_api_request( "POST", f"workspaces/{workspace_id}/items/{pipeline.id}/updateDefinition", payload=update_payload, ) logger.info( f"Successfully added {activity_type} activity '{activity_name}' to pipeline {pipeline.id}" ) return pipeline.id except FabricValidationError: raise except FabricItemNotFoundError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to add activity from JSON to pipeline: {exc}") raise FabricError(f"Failed to add activity from JSON to pipeline: {exc}") def delete_activity_from_pipeline( self, workspace_id: str, pipeline_name: str, activity_name: str, ) -> str: """Delete an activity from an existing pipeline. Args: workspace_id: Workspace ID containing the pipeline pipeline_name: Name of the existing pipeline activity_name: Name of the activity to delete Returns: Pipeline ID (GUID) of the updated pipeline Raises: FabricValidationError: If activity not found or has dependencies FabricItemNotFoundError: If pipeline not found FabricAPIError: If pipeline update fails FabricError: For other errors """ logger.info( f"Deleting activity '{activity_name}' from pipeline '{pipeline_name}' " f"in workspace {workspace_id}" ) self._validate_activity_operation_inputs( workspace_id, pipeline_name, activity_name ) try: pipeline, definition = self._get_pipeline_definition( workspace_id, pipeline_name ) activities = self._get_pipeline_activities(definition) matching_indices = [ index for index, activity in enumerate(activities) if activity.get("name") == activity_name ] if not matching_indices: raise FabricValidationError( "activity_name", activity_name, "Activity not found in pipeline", ) dependents = self._find_dependent_activities(activities, activity_name) if dependents: dependent_list = ", ".join(dependents) raise FabricValidationError( "activity_name", activity_name, "Activity is referenced by dependsOn in: " f"{dependent_list}. Remove dependencies first.", ) activities[:] = [ activity for activity in activities if activity.get("name") != activity_name ] self._update_pipeline_definition(workspace_id, pipeline.id, definition) logger.info( f"Successfully deleted {len(matching_indices)} activities named " f"'{activity_name}' from pipeline {pipeline.id}" ) return pipeline.id except FabricValidationError: raise except FabricItemNotFoundError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to delete activity from pipeline: {exc}") raise FabricError(f"Failed to delete activity from pipeline: {exc}") def remove_activity_dependency( self, workspace_id: str, pipeline_name: str, activity_name: str, from_activity_name: Optional[str] = None, ) -> tuple[str, int]: """Remove dependsOn references to a target activity. Args: workspace_id: Workspace ID containing the pipeline pipeline_name: Name of the existing pipeline activity_name: Target activity name to remove dependencies to from_activity_name: Optional source activity name to limit removal Returns: Tuple of (pipeline ID, removed dependency count) Raises: FabricValidationError: If activity not found or no dependencies removed FabricItemNotFoundError: If pipeline not found FabricAPIError: If pipeline update fails FabricError: For other errors """ logger.info( f"Removing dependencies on '{activity_name}' in pipeline '{pipeline_name}' " f"from activity '{from_activity_name or 'ALL'}'" ) self._validate_activity_operation_inputs( workspace_id, pipeline_name, activity_name ) if from_activity_name is not None and not str(from_activity_name).strip(): raise FabricValidationError( "from_activity_name", str(from_activity_name), "From activity name cannot be empty", ) try: pipeline, definition = self._get_pipeline_definition( workspace_id, pipeline_name ) activities = self._get_pipeline_activities(definition) activity_names = { activity.get("name") for activity in activities if activity.get("name") } if from_activity_name: if from_activity_name not in activity_names: raise FabricValidationError( "from_activity_name", from_activity_name, "From activity not found in pipeline", ) source_activity = next( activity for activity in activities if activity.get("name") == from_activity_name ) removed_count = self._remove_dependency_from_activity( source_activity, activity_name ) else: removed_count = 0 for activity in activities: removed_count += self._remove_dependency_from_activity( activity, activity_name ) if removed_count == 0: raise FabricValidationError( "activity_name", activity_name, "No dependencies found to remove", ) self._update_pipeline_definition(workspace_id, pipeline.id, definition) logger.info( f"Removed {removed_count} dependencies on '{activity_name}' " f"from pipeline {pipeline.id}" ) return pipeline.id, removed_count except FabricValidationError: raise except FabricItemNotFoundError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to remove activity dependencies: {exc}") raise FabricError(f"Failed to remove activity dependencies: {exc}") def add_activity_dependency( self, workspace_id: str, pipeline_name: str, activity_name: str, depends_on: list[str], ) -> tuple[str, int]: """Add dependsOn references to a target activity.""" logger.info( f"Adding dependencies to '{activity_name}' in pipeline '{pipeline_name}'" ) self._validate_activity_operation_inputs( workspace_id, pipeline_name, activity_name ) if not depends_on or not isinstance(depends_on, list): raise FabricValidationError( "depends_on", str(depends_on), "depends_on must be a non-empty list", ) if any(not str(name).strip() for name in depends_on): raise FabricValidationError( "depends_on", str(depends_on), "depends_on entries cannot be empty", ) try: pipeline, definition = self._get_pipeline_definition( workspace_id, pipeline_name ) activities = self._get_pipeline_activities(definition) activity_names = { activity.get("name") for activity in activities if activity.get("name") } if activity_name not in activity_names: raise FabricValidationError( "activity_name", activity_name, "Activity not found in pipeline", ) missing = [name for name in depends_on if name not in activity_names] if missing: raise FabricValidationError( "depends_on", ", ".join(missing), "Dependency activities not found in pipeline", ) if activity_name in depends_on: raise FabricValidationError( "depends_on", activity_name, "Activity cannot depend on itself", ) target_activity = next( activity for activity in activities if activity.get("name") == activity_name ) if "dependsOn" not in target_activity or not isinstance( target_activity.get("dependsOn"), list ): target_activity["dependsOn"] = [] existing = { dependency.get("activity") for dependency in target_activity.get("dependsOn", []) if dependency.get("activity") } added_count = 0 for dependency_name in depends_on: if dependency_name in existing: continue target_activity["dependsOn"].append( { "activity": dependency_name, "dependencyConditions": ["Succeeded"], } ) added_count += 1 if added_count == 0: raise FabricValidationError( "depends_on", ", ".join(depends_on), "No new dependencies to add", ) self._update_pipeline_definition(workspace_id, pipeline.id, definition) logger.info( f"Added {added_count} dependencies to '{activity_name}' in pipeline {pipeline.id}" ) return pipeline.id, added_count except FabricValidationError: raise except FabricItemNotFoundError: raise except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to add activity dependencies: {exc}") raise FabricError(f"Failed to add activity dependencies: {exc}") def _validate_notebook_activity_inputs( self, workspace_id: str, pipeline_name: str, notebook_name: str, activity_name: str, ) -> None: if not workspace_id or not str(workspace_id).strip(): raise FabricValidationError( "workspace_id", str(workspace_id), "Workspace ID cannot be empty" ) if not pipeline_name or not pipeline_name.strip(): raise FabricValidationError( "pipeline_name", pipeline_name, "Pipeline name cannot be empty" ) if not notebook_name or not notebook_name.strip(): raise FabricValidationError( "notebook_name", notebook_name, "Notebook name cannot be empty" ) if not activity_name or not activity_name.strip(): raise FabricValidationError( "activity_name", activity_name, "Activity name cannot be empty" ) def _validate_activity_operation_inputs( self, workspace_id: str, pipeline_name: str, activity_name: str, ) -> None: if not workspace_id or not str(workspace_id).strip(): raise FabricValidationError( "workspace_id", str(workspace_id), "Workspace ID cannot be empty" ) if not pipeline_name or not pipeline_name.strip(): raise FabricValidationError( "pipeline_name", pipeline_name, "Pipeline name cannot be empty" ) if not activity_name or not activity_name.strip(): raise FabricValidationError( "activity_name", activity_name, "Activity name cannot be empty" ) def _validate_dataflow_activity_inputs( self, workspace_id: str, pipeline_name: str, dataflow_name: str, activity_name: str, ) -> None: if not workspace_id or not str(workspace_id).strip(): raise FabricValidationError( "workspace_id", str(workspace_id), "Workspace ID cannot be empty" ) if not pipeline_name or not pipeline_name.strip(): raise FabricValidationError( "pipeline_name", pipeline_name, "Pipeline name cannot be empty" ) if not dataflow_name or not dataflow_name.strip(): raise FabricValidationError( "dataflow_name", dataflow_name, "Dataflow name cannot be empty" ) if not activity_name or not activity_name.strip(): raise FabricValidationError( "activity_name", activity_name, "Activity name cannot be empty" ) def _get_pipeline_definition( self, workspace_id: str, pipeline_name: str ) -> tuple[Any, Dict[str, Any]]: pipeline = self.item_service.get_item_by_name( workspace_id, pipeline_name, "DataPipeline" ) definition_response = self.item_service.get_item_definition( workspace_id, pipeline.id ) parts = definition_response.get("definition", {}).get("parts", []) pipeline_content_part = None for part in parts: if part.get("path") == "pipeline-content.json": pipeline_content_part = part break if not pipeline_content_part: raise FabricError("Pipeline definition missing pipeline-content.json part") encoded_payload = pipeline_content_part.get("payload", "") existing_definition = self._decode_definition(encoded_payload) return pipeline, existing_definition def _get_pipeline_activities(self, definition: Dict[str, Any]) -> list: if "properties" not in definition: definition["properties"] = {} if "activities" not in definition["properties"]: definition["properties"]["activities"] = [] return definition["properties"]["activities"] def _find_activity_index( self, activities: list, activity_name: str ) -> Optional[int]: for index, activity in enumerate(activities): if activity.get("name") == activity_name: return index return None def _find_dependent_activities(self, activities: list, activity_name: str) -> list: dependents = [] for activity in activities: for dependency in activity.get("dependsOn", []) or []: if dependency.get("activity") == activity_name: dependents.append(activity.get("name") or "UnnamedActivity") break return dependents def _remove_dependency_from_activity( self, activity: Dict[str, Any], target_name: str, ) -> int: depends_on = activity.get("dependsOn") if not depends_on or not isinstance(depends_on, list): return 0 original_len = len(depends_on) filtered = [ dependency for dependency in depends_on if dependency.get("activity") != target_name ] if len(filtered) != original_len: activity["dependsOn"] = filtered return original_len - len(filtered) def _append_activity_to_definition( self, definition: Dict[str, Any], activity: Dict[str, Any], depends_on_activity_name: Optional[str] = None, ) -> None: if "properties" not in definition: definition["properties"] = {} if "activities" not in definition["properties"]: definition["properties"]["activities"] = [] activities = definition["properties"]["activities"] existing_names = {item.get("name") for item in activities if item.get("name")} if activity.get("name") in existing_names: raise FabricValidationError( "activity_name", activity.get("name", ""), "Activity name already exists in pipeline", ) if depends_on_activity_name: if depends_on_activity_name not in existing_names: raise FabricValidationError( "depends_on_activity_name", depends_on_activity_name, "Dependent activity does not exist in pipeline", ) activity["dependsOn"].append( { "activity": depends_on_activity_name, "dependencyConditions": ["Succeeded"], } ) activities.append(activity) def _update_pipeline_definition( self, workspace_id: str, pipeline_id: str, definition: Dict[str, Any] ) -> None: encoded_definition = self._encode_definition(definition) update_payload = { "definition": { "parts": [ { "path": "pipeline-content.json", "payload": encoded_definition, "payloadType": "InlineBase64", } ] } } self.client.make_api_request( "POST", f"workspaces/{workspace_id}/items/{pipeline_id}/updateDefinition", payload=update_payload, ) def get_pipeline_activity_runs( self, workspace_id: str, job_instance_id: str, status_filter: Optional[str] = None, activity_name_filter: Optional[str] = None, ) -> Dict[str, Any]: """Get activity runs for a pipeline job execution. Queries the Fabric queryactivityruns API to retrieve per-activity execution details for a given pipeline run. Args: workspace_id: Workspace ID containing the pipeline job_instance_id: Job instance ID from run_on_demand_job or get_job_status status_filter: Optional filter by status (Succeeded, Failed, InProgress, Cancelled) activity_name_filter: Optional filter by activity name Returns: Dictionary with activity runs and metadata: { "activities": [...], # List of PipelineActivityRun-like dicts "activity_count": int, "pipeline_name": str or None } Raises: FabricValidationError: If inputs are invalid FabricAPIError: If the API call fails """ if not workspace_id or not str(workspace_id).strip(): raise FabricValidationError( "workspace_id", str(workspace_id), "Workspace ID cannot be empty" ) if not job_instance_id or not str(job_instance_id).strip(): raise FabricValidationError( "job_instance_id", str(job_instance_id), "Job instance ID cannot be empty", ) # Build time window: 7 days ago to 1 day in future from datetime import datetime, timedelta, timezone now = datetime.now(timezone.utc) last_updated_after = (now - timedelta(days=7)).isoformat() last_updated_before = (now + timedelta(days=1)).isoformat() # Build request payload payload: Dict[str, Any] = { "lastUpdatedAfter": last_updated_after, "lastUpdatedBefore": last_updated_before, } # Add filters if specified filters = [] if status_filter: filters.append( { "operand": "Status", "operator": "Equals", "values": [status_filter], } ) if activity_name_filter: filters.append( { "operand": "ActivityName", "operator": "Equals", "values": [activity_name_filter], } ) if filters: payload["filters"] = filters # Call the API try: response = self.client.make_api_request( "POST", f"workspaces/{workspace_id}/datapipelines/pipelineruns/{job_instance_id}/queryactivityruns", payload=payload, ) response_data = response.json() except FabricAPIError: raise except Exception as exc: logger.error(f"Failed to get pipeline activity runs: {exc}") raise FabricError(f"Failed to get pipeline activity runs: {exc}") # Extract pipeline name from first activity if available pipeline_name = None raw_activities = response_data.get("value", []) if raw_activities: pipeline_name = raw_activities[0].get("pipelineName") # Transform raw response to curated format activities = [] for raw in raw_activities: activity = self._transform_activity_run(raw) activities.append(activity) return { "activities": activities, "activity_count": len(activities), "pipeline_name": pipeline_name, } def _transform_activity_run(self, raw: Dict[str, Any]) -> Dict[str, Any]: """Transform raw API response to curated activity run format.""" output = raw.get("output") or {} error = raw.get("error") or {} return { "activity_name": raw.get("activityName"), "activity_type": raw.get("activityType"), "status": raw.get("status"), "duration_ms": raw.get("durationInMs"), "start_time": raw.get("activityRunStart"), "end_time": raw.get("activityRunEnd"), "rows_read": output.get("rowsRead"), "rows_written": output.get("rowsCopied"), "error_message": error.get("message") if error else None, }

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/bablulawrence/ms-fabric-mcp-server'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

pipeline.py•84.5 KiB