Skip to main content
Glama
ThreatFlux

Playwright Fetch MCP Server

by ThreatFlux

Servidor MCP de Playwright Fetch

Lanzamiento de GitHub (última fecha) CI código decodificador Licencia: MIT Versión de Python Dramaturgo MCP Estilo de código: negro

Un servidor de Protocolo de Contexto de Modelo (MLM) que proporciona capacidades de obtención de contenido web mediante Playwright para la automatización del navegador. Este servidor permite a los LLM recuperar y procesar contenido generado en JavaScript desde páginas web, convirtiendo HTML a Markdown para facilitar su uso.

Autor

Creado por Wyatt Roersma con la ayuda de Claude Code.

Related MCP server: MCP Playwright CDP

Características principales

  • Automatización del navegador : utiliza Playwright para renderizar páginas web con compatibilidad total con JavaScript

  • Extracción de contenido : identifica y extrae automáticamente las principales áreas de contenido de las páginas web

  • Conversión de Markdown : convierte HTML a Markdown limpio y legible

  • Soporte de paginación : maneja contenido grande a través de la paginación

  • Cumplimiento de Robots.txt : respeta las directivas de robots.txt para la búsqueda autónoma

  • Compatibilidad con proxy : permite enrutar solicitudes a través de un servidor proxy

  • Docker Ready : disponible como imágenes de Docker prediseñadas a través de Docker Hub y GitHub Container Registry

Herramientas disponibles

  • playwright-fetch : obtiene una URL mediante la automatización del navegador Playwright y extrae su contenido como Markdown.

    • url (cadena, obligatoria): URL para obtener

    • max_length (entero, opcional): número máximo de caracteres a devolver (predeterminado: 5000)

    • start_index (entero, opcional): comienza el contenido a partir de este índice de caracteres (valor predeterminado: 0)

    • raw (booleano, opcional): obtener contenido sin procesar sin conversión de Markdown (valor predeterminado: falso)

    • wait_for_js (booleano, opcional): espera a que se ejecute JavaScript (valor predeterminado: verdadero)

Indicaciones

  • dramaturgo-fetch

    • Obtenga una URL usando Playwright y extraiga su contenido como Markdown

    • Argumentos:

      • url (cadena, obligatoria): URL para obtener

Requisitos

  • Python 3.13.2 o más reciente

  • administrador de paquetes uv

  • Navegadores de dramaturgos instalados

Instalación

1. Instalar con uv (recomendado)

uv pip install git+https://github.com/ThreatFlux/playwright-fetch.git
# Install Playwright browsers
uv pip exec playwright install

Alternativamente, clone el repositorio e instale:

git clone https://github.com/ThreatFlux/playwright-fetch.git
cd playwright-fetch
uv pip install -e .
# Install Playwright browsers
uv pip exec playwright install

2. Uso de Docker

Puede utilizar nuestras imágenes Docker prediseñadas desde Docker Hub o GitHub Container Registry:

# From Docker Hub
docker pull threatflux/playwright-fetch:latest

# From GitHub Container Registry
docker pull ghcr.io/threatflux/playwright-fetch:latest

O construyelo tu mismo:

docker build -t threatflux/playwright-fetch .

Configuración

Configurar para Claude.app

Añade a tu configuración de Claude:

"mcpServers": {
  "playwright-fetch": {
    "command": "uvx",
    "args": ["mcp-server-playwright-fetch"]
  }
}
"mcpServers": {
  "playwright-fetch": {
    "command": "docker",
    "args": ["run", "-i", "--rm", "threatflux/playwright-fetch"]
  }
}

Configurar para VS Code

Para la instalación manual, agregue el siguiente bloque JSON a su archivo de configuración de usuario (JSON) en VS Code.

{
  "mcp": {
    "servers": {
      "playwright-fetch": {
        "command": "uvx",
        "args": ["mcp-server-playwright-fetch"]
      }
    }
  }
}
{
  "mcp": {
    "servers": {
      "playwright-fetch": {
        "command": "docker",
        "args": ["run", "-i", "--rm", "threatflux/playwright-fetch"]
      }
    }
  }
}

Opciones de línea de comandos

El servidor admite estas opciones de línea de comandos:

  • --user-agent : cadena de agente de usuario personalizada

  • --ignore-robots-txt : Ignorar las restricciones de robots.txt

  • --proxy-url : URL de proxy que se utilizará para las solicitudes

  • --headless : ejecuta el navegador en modo sin cabeza (valor predeterminado: Verdadero)

  • --wait-until : Cuándo considerar que la navegación fue exitosa (opciones: "load", "domcontentloaded", "networkidle", "commit", predeterminado: "networkidle")

Ejemplo de uso

# Run with default settings
uv run mcp-server-playwright-fetch

# Run with a custom user agent and proxy
uv run mcp-server-playwright-fetch --user-agent="MyCustomAgent/1.0" --proxy-url="http://myproxy:8080"

# Run with visible browser for debugging
uv run mcp-server-playwright-fetch --headless=false

Depuración

Puede utilizar el inspector MCP para depurar el servidor:

npx @modelcontextprotocol/inspector uvx mcp-server-playwright-fetch

Diferencias con el servidor de búsqueda estándar

Esta implementación se diferencia del servidor MCP de búsqueda estándar en los siguientes aspectos:

  1. Automatización del navegador : utiliza Playwright para renderizar páginas con mucho contenido de JavaScript

  2. Extracción de contenido : intenta extraer el contenido principal de estructuras de páginas comunes

  3. Opciones de espera : estrategia de carga de página configurable (espera de carga, contenido DOM, red inactiva)

  4. Opción de navegador visible : se puede ejecutar con un navegador visible para depuración

Licencia

Este proyecto está licenciado bajo la Licencia MIT. Consulte el archivo de LICENCIA para más detalles.

Install Server
A
license - permissive license
B
quality
C
maintenance

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/ThreatFlux/playwright-fetch'

If you have feedback or need assistance with the MCP directory API, please join our Discord server