MCP Video Extraction Plus

bcut_asr.py•6.23 KiB

import json import logging import time from typing import Any, Callable, List, Optional, Union import requests try: from .asr_data import ASRDataSeg from .base_asr import BaseASR from .status import ASRStatus except ImportError: from asr_data import ASRDataSeg from base_asr import BaseASR from status import ASRStatus logger = logging.getLogger(__name__) __version__ = "0.0.3" API_BASE_URL = "https://member.bilibili.com/x/bcut/rubick-interface" API_REQ_UPLOAD = API_BASE_URL + "/resource/create" API_COMMIT_UPLOAD = API_BASE_URL + "/resource/create/complete" API_CREATE_TASK = API_BASE_URL + "/task" API_QUERY_RESULT = API_BASE_URL + "/task/result" class BcutASR(BaseASR): """Bilibili Bcut ASR API implementation. Uses Bilibili's cloud ASR service with multipart upload support. """ headers = { "User-Agent": "Bilibili/1.0.0 (https://www.bilibili.com)", "Content-Type": "application/json", } def __init__( self, audio_path: Union[str, bytes], use_cache: bool = True, need_word_time_stamp: bool = False, ): super().__init__(audio_path, use_cache=use_cache) self.session = requests.Session() self.task_id: Optional[str] = None self.__etags: List[str] = [] self.__in_boss_key: Optional[str] = None self.__resource_id: Optional[str] = None self.__upload_id: Optional[str] = None self.__upload_urls: List[str] = [] self.__per_size: Optional[int] = None self.__clips: Optional[int] = None self.__etags_final: Optional[List[str]] = [] self.__download_url: Optional[str] = None self.need_word_time_stamp = need_word_time_stamp def upload(self) -> None: """Request upload authorization and upload audio file.""" if not self.file_binary: raise ValueError("No audio data to upload") payload = json.dumps( { "type": 2, "name": "audio.mp3", "size": len(self.file_binary), "ResourceFileType": "mp3", "model_id": "8", } ) resp = requests.post(API_REQ_UPLOAD, data=payload, headers=self.headers) resp.raise_for_status() resp = resp.json() resp_data = resp["data"] self.__in_boss_key = resp_data["in_boss_key"] self.__resource_id = resp_data["resource_id"] self.__upload_id = resp_data["upload_id"] self.__upload_urls = resp_data["upload_urls"] self.__per_size = resp_data["per_size"] self.__clips = len(resp_data["upload_urls"]) self.__upload_part() self.__commit_upload() def __upload_part(self) -> None: """Upload audio data in multiple parts.""" if ( self.__clips is None or self.__per_size is None or self.__upload_urls is None or self.file_binary is None ): raise ValueError("Upload parameters not initialized") for clip in range(self.__clips): start_range = clip * self.__per_size end_range = (clip + 1) * self.__per_size resp = requests.put( self.__upload_urls[clip], data=self.file_binary[start_range:end_range], headers=self.headers, ) resp.raise_for_status() etag = resp.headers.get("Etag") if etag is not None: self.__etags.append(etag) def __commit_upload(self) -> None: """Commit the upload and get download URL.""" data = json.dumps( { "InBossKey": self.__in_boss_key, "ResourceId": self.__resource_id, "Etags": ",".join(self.__etags) if self.__etags else "", "UploadId": self.__upload_id, "model_id": "8", } ) resp = requests.post(API_COMMIT_UPLOAD, data=data, headers=self.headers) resp.raise_for_status() resp = resp.json() self.__download_url = resp["data"]["download_url"] def create_task(self) -> str: """Create ASR task.""" resp = requests.post( API_CREATE_TASK, json={"resource": self.__download_url, "model_id": "8"}, headers=self.headers, ) resp.raise_for_status() resp = resp.json() self.task_id = resp["data"]["task_id"] return self.task_id or "" def result(self, task_id: Optional[str] = None): """Query ASR result.""" resp = requests.get( API_QUERY_RESULT, params={"model_id": 7, "task_id": task_id or self.task_id}, headers=self.headers, ) resp.raise_for_status() resp = resp.json() return resp["data"] def _run( self, callback: Optional[Callable[[int, str], None]] = None, **kwargs: Any ) -> dict: """Execute ASR workflow: upload -> create task -> poll result.""" self._check_rate_limit() def _default_callback(x, y): pass if callback is None: callback = _default_callback callback(*ASRStatus.UPLOADING.callback_tuple()) self.upload() callback(*ASRStatus.CREATING_TASK.callback_tuple()) self.create_task() callback(*ASRStatus.TRANSCRIBING.callback_tuple()) # Poll task status until complete task_resp = None for _ in range(500): task_resp = self.result() if task_resp["state"] == 4: break time.sleep(1) if task_resp is None or task_resp["state"] != 4: raise RuntimeError("ASR task failed or timeout") callback(*ASRStatus.COMPLETED.callback_tuple()) return json.loads(task_resp["result"]) def _make_segments(self, resp_data: dict) -> List[ASRDataSeg]: if self.need_word_time_stamp: return [ ASRDataSeg(w["label"].strip(), w["start_time"], w["end_time"]) for u in resp_data["utterances"] for w in u["words"] ] else: return [ ASRDataSeg(u["transcript"], u["start_time"], u["end_time"]) for u in resp_data["utterances"] ]

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/takereshui/mcp-video-extraction-plus'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

bcut_asr.py•6.23 KiB