@arizeai/phoenix-mcp

Official

Overview Schema Related Servers Score Discussions

utils.ts•11.1 KiB

import { graphql, readInlineData } from "relay-runtime"; import type { CreateDatasetLLMEvaluatorInput } from "@phoenix/components/dataset/__generated__/CreateLLMDatasetEvaluatorSlideover_createLLMEvaluatorMutation.graphql"; import type { UpdateDatasetLLMEvaluatorInput } from "@phoenix/components/dataset/__generated__/EditLLMDatasetEvaluatorSlideover_updateLLMEvaluatorMutation.graphql"; import { utils_datasetExampleToEvaluatorInput_example$key } from "@phoenix/components/evaluators/__generated__/utils_datasetExampleToEvaluatorInput_example.graphql"; import { usePlaygroundStore } from "@phoenix/contexts/PlaygroundContext"; import { getInstancePromptParamsFromStore } from "@phoenix/pages/playground/playgroundPromptUtils"; import { fromOpenAIToolDefinition, toOpenAIToolDefinition, } from "@phoenix/schemas"; import { CategoricalChoiceToolType, CategoricalChoiceToolTypeSchema, } from "@phoenix/schemas/phoenixToolTypeSchemas"; import { fromOpenAIToolChoice } from "@phoenix/schemas/toolChoiceSchemas"; import { type AnnotationConfig } from "@phoenix/store/evaluatorStore"; import type { ClassificationEvaluatorAnnotationConfig, EvaluatorInputMapping, EvaluatorMappingSource, EvaluatorOptimizationDirection, } from "@phoenix/types"; const createPromptVersionInput = ({ playgroundStore, instanceId, description, outputConfigs, includeExplanation, }: { playgroundStore: ReturnType<typeof usePlaygroundStore>; instanceId: number; name: string; /** * The description of the evaluator. */ description?: string; /** * The output configs of the evaluator. Only categorical configs generate tools. */ outputConfigs: AnnotationConfig[]; /** * Whether to include an explanation for the evaluation score. */ includeExplanation: boolean; /** * The input mapping of the evaluator. */ inputMapping?: EvaluatorInputMapping; /** * The dataset ID to assign the evaluator to. */ datasetId?: string; }) => { const { promptInput, templateFormat, promptVersionId } = getInstancePromptParamsFromStore(instanceId, playgroundStore); // Build one tool per categorical output config const categoricalConfigs = outputConfigs.filter( (c): c is ClassificationEvaluatorAnnotationConfig => "values" in c ); const tools = categoricalConfigs.map((config) => ({ definition: fromOpenAIToolDefinition({ toolDefinition: CategoricalChoiceToolTypeSchema.parse({ type: "function", function: { name: config.name, description, parameters: { type: "object", properties: { label: { type: "string", enum: config.values.map((value) => value.label), description: config.name, }, ...(includeExplanation ? { explanation: { type: "string", description: `Explanation for choosing the label "${config.name}"`, }, } : {}), }, required: ["label", ...(includeExplanation ? ["explanation"] : [])], }, }, } satisfies CategoricalChoiceToolType), targetProvider: promptInput.modelProvider, }), })); const prunedPromptInput: CreateDatasetLLMEvaluatorInput["promptVersion"] = { ...promptInput, templateFormat, invocationParameters: { ...promptInput.invocationParameters, // add a required tool choice to the invocation parameters tool_choice: fromOpenAIToolChoice({ toolChoice: "required", targetProvider: promptInput.modelProvider, }), }, tools, responseFormat: undefined, }; return { prunedPromptInput, promptVersionId, }; }; export const updateLLMEvaluatorPayload = ({ playgroundStore, instanceId, name: rawName, description: rawDescription, outputConfigs, datasetId, datasetEvaluatorId, inputMapping, includeExplanation, }: { datasetEvaluatorId: string; datasetId: string; playgroundStore: ReturnType<typeof usePlaygroundStore>; instanceId: number; name: string; description: string; /** * The output configs for the evaluator. Used for prompt tool definitions and GraphQL payload. */ outputConfigs: AnnotationConfig[]; inputMapping?: EvaluatorInputMapping; includeExplanation: boolean; }): UpdateDatasetLLMEvaluatorInput => { const name = rawName.trim(); const description = rawDescription.trim() || undefined; const { prunedPromptInput: promptVersion, promptVersionId } = createPromptVersionInput({ playgroundStore, instanceId, name, description, outputConfigs, includeExplanation, }); return { name, description, datasetEvaluatorId, datasetId, inputMapping: inputMapping, promptVersion, outputConfigs: buildOutputConfigsInput(outputConfigs), promptVersionId: promptVersionId ?? null, }; }; /** * Create a payload for the createLLMEvaluator or updateLLMEvaluator mutations. */ export const createLLMEvaluatorPayload = ({ playgroundStore, instanceId, name: rawName, description: rawDescription, outputConfigs, datasetId, inputMapping, includeExplanation, }: { /** * The playground store to use to get the instance prompt params. */ playgroundStore: ReturnType<typeof usePlaygroundStore>; /** * The instance ID to use to get the instance prompt params. */ instanceId: number; /** * The name of the evaluator. */ name: string; /** * The description of the evaluator. */ description: string; /** * The output configs for the evaluator. Used for prompt tool definitions and GraphQL payload. */ outputConfigs: AnnotationConfig[]; /** * The input mapping of the evaluator. */ inputMapping?: EvaluatorInputMapping; /** * Whether to include an explanation for the evaluation score. */ includeExplanation: boolean; /** * The dataset ID to assign the evaluator to. */ datasetId: string; }): CreateDatasetLLMEvaluatorInput => { const name = rawName.trim(); const description = rawDescription.trim() || undefined; const { prunedPromptInput: promptVersion, promptVersionId } = createPromptVersionInput({ playgroundStore, instanceId, name, description, outputConfigs, includeExplanation, }); return { name, description, datasetId, inputMapping: inputMapping, promptVersion, outputConfigs: buildOutputConfigsInput(outputConfigs), promptVersionId: promptVersionId ?? null, }; }; export type CreateLLMEvaluatorPayload = ReturnType< typeof createLLMEvaluatorPayload >; export const datasetExampleToEvaluatorInput = ({ exampleRef, taskOutput = {}, }: { exampleRef: utils_datasetExampleToEvaluatorInput_example$key; taskOutput?: Record<string, unknown>; }): EvaluatorMappingSource => { const example = readInlineData( graphql` fragment utils_datasetExampleToEvaluatorInput_example on DatasetExampleRevision @inline { input output metadata } `, exampleRef ); return { input: example.input, output: taskOutput, reference: example.output, metadata: example.metadata, }; }; /** * Checks whether the prompt tools are configured to generate an explanation, looking for * the format generated by the createPromptVersionInput helper above. */ export const inferIncludeExplanationFromPrompt = ( promptTools?: readonly { readonly definition: unknown }[] ): boolean => { if (!promptTools || promptTools.length === 0) { return false; } const tool = promptTools[0]; if (!tool?.definition) { return false; } try { const definition = typeof tool.definition === "string" ? JSON.parse(tool.definition) : tool.definition; const toolDefinitionAsOpenAI = toOpenAIToolDefinition(definition); if (!toolDefinitionAsOpenAI) { return false; } return ( toolDefinitionAsOpenAI.function.parameters?.properties?.explanation !== undefined ); } catch { return false; } }; /** * Convert an annotation config to the GraphQL AnnotationConfigInput format. * * This function transforms frontend annotation configs into the format * expected by the GraphQL mutations. */ const toAnnotationConfigInput = ( config: AnnotationConfig ): { categorical?: { name: string; optimizationDirection: EvaluatorOptimizationDirection; values: { label: string; score: number | null }[]; }; continuous?: { name: string; optimizationDirection: EvaluatorOptimizationDirection; lowerBound?: number | null; upperBound?: number | null; }; } => { if ("values" in config) { // Categorical config return { categorical: { name: config.name, optimizationDirection: config.optimizationDirection, values: config.values.map((v) => ({ label: v.label, score: v.score ?? null, })), }, }; } // Continuous config return { continuous: { name: config.name, optimizationDirection: config.optimizationDirection, lowerBound: config.lowerBound ?? null, upperBound: config.upperBound ?? null, }, }; }; /** * Convert an array of annotation configs to the GraphQL outputConfigs format. * * @param configs - Array of annotation configs from the store * @returns Array of AnnotationConfigInput objects for GraphQL */ export const buildOutputConfigsInput = ( configs: AnnotationConfig[] ): ReturnType<typeof toAnnotationConfigInput>[] => { return configs.map(toAnnotationConfigInput); }; /** * Validates that all output config names are unique. * * @param configs - Array of annotation configs to validate * @returns An object with `isValid` boolean and `duplicateNames` set of duplicate names */ const validateOutputConfigNames = ( configs: AnnotationConfig[] ): { isValid: boolean; duplicateNames: Set<string>; emptyNames: number[] } => { const names = configs.map((config) => config.name); const seen = new Set<string>(); const duplicateNames = new Set<string>(); const emptyNames: number[] = []; names.forEach((name, index) => { if (!name || name.trim() === "") { emptyNames.push(index); } else if (seen.has(name)) { duplicateNames.add(name); } seen.add(name); }); return { isValid: duplicateNames.size === 0 && emptyNames.length === 0, duplicateNames, emptyNames, }; }; /** * Returns an array of validation error messages for output configs. * * @param configs - Array of annotation configs to validate * @returns Array of error messages, or empty array if valid */ export const getOutputConfigValidationErrors = ( configs: AnnotationConfig[] ): string[] => { const errors: string[] = []; const { duplicateNames, emptyNames } = validateOutputConfigNames(configs); if (emptyNames.length > 0) { errors.push( `Output config name${emptyNames.length > 1 ? "s" : ""} cannot be empty` ); } if (duplicateNames.size > 0) { errors.push( `Duplicate output config names: ${Array.from(duplicateNames).join(", ")}` ); } return errors; };

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/Arize-ai/phoenix'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

utils.ts•11.1 KiB