MCP Video Recognition Server

Overview Schema Related Servers Score Discussions

audio-recognition.ts•2.88 KiB

/** * Audio recognition tool for MCP server */ import { z } from 'zod'; import { createLogger } from '../utils/logger.js'; import { GeminiService } from '../services/gemini.js'; import { AudioRecognitionParamsSchema } from '../types/index.js'; import type { CallToolResult } from '@modelcontextprotocol/sdk/types.js'; import type { AudioRecognitionParams } from '../types/index.js'; import * as fs from 'node:fs'; import * as path from 'node:path'; const log = createLogger('AudioRecognitionTool'); export const createAudioRecognitionTool = (geminiService: GeminiService) => { return { name: 'audio_recognition', description: 'Analyze and transcribe audio using Google Gemini AI', inputSchema: AudioRecognitionParamsSchema, callback: async (args: AudioRecognitionParams): Promise<CallToolResult> => { try { log.info(`Processing audio recognition request for file: ${args.filepath}`); log.verbose('Audio recognition request', JSON.stringify(args)); // Verify file exists if (!fs.existsSync(args.filepath)) { throw new Error(`Audio file not found: ${args.filepath}`); } // Verify file is an audio const ext = path.extname(args.filepath).toLowerCase(); if (!['.mp3', '.wav', '.ogg'].includes(ext)) { throw new Error(`Unsupported audio format: ${ext}. Supported formats are: .mp3, .wav, .ogg`); } // Default prompt if not provided const prompt = args.prompt || 'Describe this audio'; const modelName = args.modelname || 'gemini-2.0-flash'; // Upload the file log.info('Uploading audio file...'); const file = await geminiService.uploadFile(args.filepath); // Process with Gemini log.info('Generating content from audio...'); const result = await geminiService.processFile(file, prompt, modelName); if (result.isError) { log.error(`Error in audio recognition: ${result.text}`); return { content: [ { type: 'text', text: result.text } ], isError: true }; } log.info('Audio recognition completed successfully'); log.verbose('Audio recognition result', JSON.stringify(result)); return { content: [ { type: 'text', text: result.text } ] }; } catch (error) { log.error('Error in audio recognition tool', error); const errorMessage = error instanceof Error ? error.message : String(error); return { content: [ { type: 'text', text: `Error processing audio: ${errorMessage}` } ], isError: true }; } } }; };

Loading blob content...

Implementation Reference

audio_recognition

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/mario-andreschak/mcp_video_recognition'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

audio-recognition.ts•2.88 KiB