Skip to main content
Glama
ThreatFlux
by ThreatFlux

Servidor MCP de Playwright Fetch

Lanzamiento de GitHub (última fecha) CI código decodificador Licencia: MIT Versión de Python Dramaturgo MCP Estilo de código: negro

Un servidor de Protocolo de Contexto de Modelo (MLM) que proporciona capacidades de obtención de contenido web mediante Playwright para la automatización del navegador. Este servidor permite a los LLM recuperar y procesar contenido generado en JavaScript desde páginas web, convirtiendo HTML a Markdown para facilitar su uso.

Autor

Creado por Wyatt Roersma con la ayuda de Claude Code.

Related MCP server: MCP Playwright CDP

Características principales

  • Automatización del navegador : utiliza Playwright para renderizar páginas web con compatibilidad total con JavaScript

  • Extracción de contenido : identifica y extrae automáticamente las principales áreas de contenido de las páginas web

  • Conversión de Markdown : convierte HTML a Markdown limpio y legible

  • Soporte de paginación : maneja contenido grande a través de la paginación

  • Cumplimiento de Robots.txt : respeta las directivas de robots.txt para la búsqueda autónoma

  • Compatibilidad con proxy : permite enrutar solicitudes a través de un servidor proxy

  • Docker Ready : disponible como imágenes de Docker prediseñadas a través de Docker Hub y GitHub Container Registry

Herramientas disponibles

  • playwright-fetch : obtiene una URL mediante la automatización del navegador Playwright y extrae su contenido como Markdown.

    • url (cadena, obligatoria): URL para obtener

    • max_length (entero, opcional): número máximo de caracteres a devolver (predeterminado: 5000)

    • start_index (entero, opcional): comienza el contenido a partir de este índice de caracteres (valor predeterminado: 0)

    • raw (booleano, opcional): obtener contenido sin procesar sin conversión de Markdown (valor predeterminado: falso)

    • wait_for_js (booleano, opcional): espera a que se ejecute JavaScript (valor predeterminado: verdadero)

Indicaciones

  • dramaturgo-fetch

    • Obtenga una URL usando Playwright y extraiga su contenido como Markdown

    • Argumentos:

      • url (cadena, obligatoria): URL para obtener

Requisitos

  • Python 3.13.2 o más reciente

  • administrador de paquetes uv

  • Navegadores de dramaturgos instalados

Instalación

1. Instalar con uv (recomendado)

uv pip install git+https://github.com/ThreatFlux/playwright-fetch.git # Install Playwright browsers uv pip exec playwright install

Alternativamente, clone el repositorio e instale:

git clone https://github.com/ThreatFlux/playwright-fetch.git cd playwright-fetch uv pip install -e . # Install Playwright browsers uv pip exec playwright install

2. Uso de Docker

Puede utilizar nuestras imágenes Docker prediseñadas desde Docker Hub o GitHub Container Registry:

# From Docker Hub docker pull threatflux/playwright-fetch:latest # From GitHub Container Registry docker pull ghcr.io/threatflux/playwright-fetch:latest

O construyelo tu mismo:

docker build -t threatflux/playwright-fetch .

Configuración

Configurar para Claude.app

Añade a tu configuración de Claude:

"mcpServers": { "playwright-fetch": { "command": "uvx", "args": ["mcp-server-playwright-fetch"] } }
"mcpServers": { "playwright-fetch": { "command": "docker", "args": ["run", "-i", "--rm", "threatflux/playwright-fetch"] } }

Configurar para VS Code

Para la instalación manual, agregue el siguiente bloque JSON a su archivo de configuración de usuario (JSON) en VS Code.

{ "mcp": { "servers": { "playwright-fetch": { "command": "uvx", "args": ["mcp-server-playwright-fetch"] } } } }
{ "mcp": { "servers": { "playwright-fetch": { "command": "docker", "args": ["run", "-i", "--rm", "threatflux/playwright-fetch"] } } } }

Opciones de línea de comandos

El servidor admite estas opciones de línea de comandos:

  • --user-agent : cadena de agente de usuario personalizada

  • --ignore-robots-txt : Ignorar las restricciones de robots.txt

  • --proxy-url : URL de proxy que se utilizará para las solicitudes

  • --headless : ejecuta el navegador en modo sin cabeza (valor predeterminado: Verdadero)

  • --wait-until : Cuándo considerar que la navegación fue exitosa (opciones: "load", "domcontentloaded", "networkidle", "commit", predeterminado: "networkidle")

Ejemplo de uso

# Run with default settings uv run mcp-server-playwright-fetch # Run with a custom user agent and proxy uv run mcp-server-playwright-fetch --user-agent="MyCustomAgent/1.0" --proxy-url="http://myproxy:8080" # Run with visible browser for debugging uv run mcp-server-playwright-fetch --headless=false

Depuración

Puede utilizar el inspector MCP para depurar el servidor:

npx @modelcontextprotocol/inspector uvx mcp-server-playwright-fetch

Diferencias con el servidor de búsqueda estándar

Esta implementación se diferencia del servidor MCP de búsqueda estándar en los siguientes aspectos:

  1. Automatización del navegador : utiliza Playwright para renderizar páginas con mucho contenido de JavaScript

  2. Extracción de contenido : intenta extraer el contenido principal de estructuras de páginas comunes

  3. Opciones de espera : estrategia de carga de página configurable (espera de carga, contenido DOM, red inactiva)

  4. Opción de navegador visible : se puede ejecutar con un navegador visible para depuración

Licencia

Este proyecto está licenciado bajo la Licencia MIT. Consulte el archivo de LICENCIA para más detalles.

One-click Deploy
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/ThreatFlux/playwright-fetch'

If you have feedback or need assistance with the MCP directory API, please join our Discord server