Playwright Fetch MCP Server

by ThreatFlux
MIT License

Integrations

  • Integrates with Codecov for code coverage reporting and tracking through CI/CD workflows.

  • Offers pre-built Docker images available through Docker Hub and GitHub Container Registry for containerized deployment.

  • Enables integration with GitHub through container registry support and CI/CD workflows.

Servidor MCP de Playwright Fetch

Un servidor de Protocolo de Contexto de Modelo (MLM) que proporciona capacidades de obtención de contenido web mediante Playwright para la automatización del navegador. Este servidor permite a los LLM recuperar y procesar contenido generado en JavaScript desde páginas web, convirtiendo HTML a Markdown para facilitar su uso.

Autor

Creado por Wyatt Roersma con la ayuda de Claude Code.

Características principales

  • Automatización del navegador : utiliza Playwright para renderizar páginas web con compatibilidad total con JavaScript
  • Extracción de contenido : identifica y extrae automáticamente las principales áreas de contenido de las páginas web
  • Conversión de Markdown : convierte HTML a Markdown limpio y legible
  • Soporte de paginación : maneja contenido grande a través de la paginación
  • Cumplimiento de Robots.txt : respeta las directivas de robots.txt para la búsqueda autónoma
  • Compatibilidad con proxy : permite enrutar solicitudes a través de un servidor proxy
  • Docker Ready : disponible como imágenes de Docker prediseñadas a través de Docker Hub y GitHub Container Registry

Herramientas disponibles

  • playwright-fetch : obtiene una URL mediante la automatización del navegador Playwright y extrae su contenido como Markdown.
    • url (cadena, obligatoria): URL para obtener
    • max_length (entero, opcional): número máximo de caracteres a devolver (predeterminado: 5000)
    • start_index (entero, opcional): comienza el contenido a partir de este índice de caracteres (valor predeterminado: 0)
    • raw (booleano, opcional): obtener contenido sin procesar sin conversión de Markdown (valor predeterminado: falso)
    • wait_for_js (booleano, opcional): espera a que se ejecute JavaScript (valor predeterminado: verdadero)

Indicaciones

  • dramaturgo-fetch
    • Obtenga una URL usando Playwright y extraiga su contenido como Markdown
    • Argumentos:
      • url (cadena, obligatoria): URL para obtener

Requisitos

  • Python 3.13.2 o más reciente
  • administrador de paquetes uv
  • Navegadores de dramaturgos instalados

Instalación

1. Instalar con uv (recomendado)

uv pip install git+https://github.com/ThreatFlux/playwright-fetch.git # Install Playwright browsers uv pip exec playwright install

Alternativamente, clone el repositorio e instale:

git clone https://github.com/ThreatFlux/playwright-fetch.git cd playwright-fetch uv pip install -e . # Install Playwright browsers uv pip exec playwright install

2. Uso de Docker

Puede utilizar nuestras imágenes Docker prediseñadas desde Docker Hub o GitHub Container Registry:

# From Docker Hub docker pull threatflux/playwright-fetch:latest # From GitHub Container Registry docker pull ghcr.io/threatflux/playwright-fetch:latest

O construyelo tu mismo:

docker build -t threatflux/playwright-fetch .

Configuración

Configurar para Claude.app

Añade a tu configuración de Claude:

"mcpServers": { "playwright-fetch": { "command": "uvx", "args": ["mcp-server-playwright-fetch"] } }
"mcpServers": { "playwright-fetch": { "command": "docker", "args": ["run", "-i", "--rm", "threatflux/playwright-fetch"] } }

Configurar para VS Code

Para la instalación manual, agregue el siguiente bloque JSON a su archivo de configuración de usuario (JSON) en VS Code.

{ "mcp": { "servers": { "playwright-fetch": { "command": "uvx", "args": ["mcp-server-playwright-fetch"] } } } }
{ "mcp": { "servers": { "playwright-fetch": { "command": "docker", "args": ["run", "-i", "--rm", "threatflux/playwright-fetch"] } } } }

Opciones de línea de comandos

El servidor admite estas opciones de línea de comandos:

  • --user-agent : cadena de agente de usuario personalizada
  • --ignore-robots-txt : Ignorar las restricciones de robots.txt
  • --proxy-url : URL de proxy que se utilizará para las solicitudes
  • --headless : ejecuta el navegador en modo sin cabeza (valor predeterminado: Verdadero)
  • --wait-until : Cuándo considerar que la navegación fue exitosa (opciones: "load", "domcontentloaded", "networkidle", "commit", predeterminado: "networkidle")

Ejemplo de uso

# Run with default settings uv run mcp-server-playwright-fetch # Run with a custom user agent and proxy uv run mcp-server-playwright-fetch --user-agent="MyCustomAgent/1.0" --proxy-url="http://myproxy:8080" # Run with visible browser for debugging uv run mcp-server-playwright-fetch --headless=false

Depuración

Puede utilizar el inspector MCP para depurar el servidor:

npx @modelcontextprotocol/inspector uvx mcp-server-playwright-fetch

Diferencias con el servidor de búsqueda estándar

Esta implementación se diferencia del servidor MCP de búsqueda estándar en los siguientes aspectos:

  1. Automatización del navegador : utiliza Playwright para renderizar páginas con mucho contenido de JavaScript
  2. Extracción de contenido : intenta extraer el contenido principal de estructuras de páginas comunes
  3. Opciones de espera : estrategia de carga de página configurable (espera de carga, contenido DOM, red inactiva)
  4. Opción de navegador visible : se puede ejecutar con un navegador visible para depuración

Licencia

Este proyecto está licenciado bajo la Licencia MIT. Consulte el archivo de LICENCIA para más detalles.

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Proporciona capacidades de obtención de contenido web mediante la automatización del navegador Playwright, lo que permite a los LLM recuperar y procesar contenido generado en JavaScript desde páginas web y convertir HTML a Markdown para un consumo más sencillo.

  1. Author
    1. Key Features
      1. Available Tools
        1. Prompts
          1. Requirements
            1. Installation
              1. 1. Install with uv (recommended)
              2. 2. Using Docker
            2. Configuration
              1. Configure for Claude.app
              2. Configure for VS Code
            3. Command Line Options
              1. Example Usage
                1. Debugging
                  1. Differences from Standard Fetch Server
                    1. License

                      Related MCP Servers

                      • A
                        security
                        A
                        license
                        A
                        quality
                        This server enables LLMs to retrieve and process content from web pages, converting HTML to markdown for easier consumption.
                        Last updated -
                        1
                        43,046
                        JavaScript
                        MIT License
                        • Linux
                        • Apple
                      • A
                        security
                        A
                        license
                        A
                        quality
                        A Model Context Protocol server that provides browser automation capabilities using Playwright. This server enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment.
                        Last updated -
                        13
                        9,719
                        3,179
                        TypeScript
                        MIT License
                        • Linux
                        • Apple
                      • A
                        security
                        F
                        license
                        A
                        quality
                        A server that enables browser automation using Playwright, allowing interaction with web pages, capturing screenshots, and executing JavaScript in a browser environment through LLMs.
                        Last updated -
                        12
                        9,719
                        1
                        TypeScript
                      • A
                        security
                        F
                        license
                        A
                        quality
                        Enables LLMs to perform browser automation through the Playwright framework with Chrome DevTools Protocol support, connecting to existing Chrome instances for advanced web interactions and JavaScript execution.
                        Last updated -
                        12
                        9
                        TypeScript

                      View all related MCP servers

                      ID: rzykt9yco6