MediaCrawler MCP Server

Overview Schema Related Servers Score Discussions

bilibili_scheme.py•4.4 KiB

# -*- coding: utf-8 -*- """ Bilibili 爬虫请求模型定义 """ from typing import Any, Dict, List, Optional from pydantic import BaseModel, Field, ConfigDict, model_validator class _BaseCrawlerRequest(BaseModel): """公共字段基类""" headless: Optional[bool] = Field(default=None, description="是否启用无头浏览器") save_media: Optional[bool] = Field(default=None, description="是否保存媒体资源") options: Dict[str, Any] = Field(default_factory=dict, description="额外参数") model_config = ConfigDict(extra="forbid") def _collect_common_params(self) -> Dict[str, Any]: params: Dict[str, Any] = {} if self.headless is not None: params["headless"] = self.headless extras = self.options.copy() if self.save_media is not None: extras.setdefault("enable_save_media", self.save_media) # 过滤掉 None 值 params.update({k: v for k, v in extras.items() if v is not None}) return params class BiliSearchRequest(_BaseCrawlerRequest): """Bilibili 搜索请求""" keywords: str = Field(..., description="搜索关键词，多个关键词用逗号分隔") page_size: int = Field(default=1, ge=1, description="单页作品数量") page_num: int = Field(default=1, ge=1, description="页码（从1开始，不循环）") @model_validator(mode="after") def normalize(self) -> "BiliSearchRequest": cleaned = ",".join(filter(None, [kw.strip() for kw in self.keywords.split(",")])) if not cleaned: raise ValueError("keywords 不能为空") self.keywords = cleaned return self def to_service_params(self) -> Dict[str, Any]: params: Dict[str, Any] = { "keywords": self.keywords, "page_size": self.page_size, "page_num": self.page_num, } params.update(self._collect_common_params()) return params class BiliDetailRequest(_BaseCrawlerRequest): """Bilibili 指定视频详情请求""" video_ids: List[str] = Field(..., min_length=1, description="视频ID列表（BV号或AV号）") @model_validator(mode="after") def sanitize_ids(self) -> "BiliDetailRequest": cleaned = [vid.strip() for vid in self.video_ids if vid and vid.strip()] if not cleaned: raise ValueError("视频ID列表不能为空") self.video_ids = cleaned return self class BiliCreatorRequest(_BaseCrawlerRequest): """Bilibili 创作者内容请求""" creator_id: str = Field(..., min_length=1, description="创作者ID") page_num: int = Field(default=1, ge=1, description="页码，从1开始") page_size: int = Field(default=30, ge=1, le=50, description="每页数量") @model_validator(mode="after") def sanitize_ids(self) -> "BiliCreatorRequest": self.creator_id = self.creator_id.strip() if not self.creator_id: raise ValueError("创作者ID列表不能为空") return self class BiliSearchTimeRangeRequest(BiliSearchRequest): """Bilibili 时间范围搜索请求""" start_day: str = Field(..., description="开始日期 YYYY-MM-DD") end_day: str = Field(..., description="结束日期 YYYY-MM-DD") max_notes_per_day: int = Field(default=50, ge=1, description="单日最大作品数量") daily_limit: bool = Field(default=False, description="是否严格限制总量") def to_service_params(self) -> Dict[str, Any]: params = super().to_service_params() params.update( { "start_day": self.start_day, "end_day": self.end_day, "max_notes_per_day": self.max_notes_per_day, "daily_limit": self.daily_limit, } ) return params class BiliCommentsRequest(_BaseCrawlerRequest): """Bilibili 评论抓取请求""" video_ids: List[str] = Field(..., min_length=1, description="视频ID列表（BV号或AV号）") max_comments: int = Field(default=20, ge=1, description="每条作品最大评论数") fetch_sub_comments: bool = Field(default=False, description="是否抓取二级评论") @model_validator(mode="after") def sanitize_ids(self) -> "BiliCommentsRequest": cleaned = [vid.strip() for vid in self.video_ids if vid and vid.strip()] if not cleaned: raise ValueError("视频ID列表不能为空") self.video_ids = cleaned return self

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/mcp-service/media-crawler-mcp-service'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

bilibili_scheme.py•4.4 KiB