browser-use MCP server

MIT License

Overview InspectNew Endpoints Schema Related Servers Reviews Score

utils.py•7.73 kB

import base64 import os import time from pathlib import Path from typing import Dict, Optional import requests from langchain_anthropic import ChatAnthropic from langchain_mistralai import ChatMistralAI from langchain_google_genai import ChatGoogleGenerativeAI from langchain_ollama import ChatOllama from langchain_openai import AzureChatOpenAI, ChatOpenAI from .llm import DeepSeekR1ChatOpenAI, DeepSeekR1ChatOllama def get_llm_model(provider: str, **kwargs): """ 获取LLM 模型 :param provider: 模型类型 :param kwargs: :return: """ if provider not in ["ollama"]: env_var = ( "GOOGLE_API_KEY" if provider == "gemini" else f"{provider.upper()}_API_KEY" ) api_key = kwargs.get("api_key", "") or os.getenv(env_var, "") if not api_key: raise ValueError(f"API key for {provider} is not set") kwargs["api_key"] = api_key if provider == "anthropic": if not kwargs.get("base_url", ""): base_url = "https://api.anthropic.com" else: base_url = kwargs.get("base_url") return ChatAnthropic( model_name=kwargs.get("model_name", "claude-3-5-sonnet-20240620"), temperature=kwargs.get("temperature", 0.0), base_url=base_url, api_key=api_key, ) elif provider == "mistral": if not kwargs.get("base_url", ""): base_url = os.getenv("MISTRAL_ENDPOINT", "https://api.mistral.ai/v1") else: base_url = kwargs.get("base_url") if not kwargs.get("api_key", ""): api_key = os.getenv("MISTRAL_API_KEY", "") else: api_key = kwargs.get("api_key") return ChatMistralAI( model=kwargs.get("model_name", "mistral-large-latest"), temperature=kwargs.get("temperature", 0.0), base_url=base_url, api_key=api_key, ) elif provider == "openai": if not kwargs.get("base_url", ""): base_url = os.getenv("OPENAI_ENDPOINT", "https://api.openai.com/v1") else: base_url = kwargs.get("base_url") return ChatOpenAI( model=kwargs.get("model_name", "gpt-4o"), temperature=kwargs.get("temperature", 0.0), base_url=base_url, api_key=api_key, ) elif provider == "deepseek": if not kwargs.get("base_url", ""): base_url = os.getenv("DEEPSEEK_ENDPOINT", "") else: base_url = kwargs.get("base_url") if kwargs.get("model_name", "deepseek-chat") == "deepseek-reasoner": return DeepSeekR1ChatOpenAI( model=kwargs.get("model_name", "deepseek-reasoner"), temperature=kwargs.get("temperature", 0.0), base_url=base_url, api_key=api_key, ) else: return ChatOpenAI( model=kwargs.get("model_name", "deepseek-chat"), temperature=kwargs.get("temperature", 0.0), base_url=base_url, api_key=api_key, ) elif provider == "gemini": return ChatGoogleGenerativeAI( model=kwargs.get("model_name", "gemini-2.0-flash-exp"), temperature=kwargs.get("temperature", 0.0), google_api_key=api_key, ) elif provider == "ollama": if not kwargs.get("base_url", ""): base_url = os.getenv("OLLAMA_ENDPOINT", "http://localhost:11434") else: base_url = kwargs.get("base_url") if "deepseek-r1" in kwargs.get("model_name", "qwen2.5:7b"): return DeepSeekR1ChatOllama( model=kwargs.get("model_name", "deepseek-r1:14b"), temperature=kwargs.get("temperature", 0.0), num_ctx=kwargs.get("num_ctx", 32000), base_url=base_url, ) else: return ChatOllama( model=kwargs.get("model_name", "qwen2.5:7b"), temperature=kwargs.get("temperature", 0.0), num_ctx=kwargs.get("num_ctx", 32000), num_predict=kwargs.get("num_predict", 1024), base_url=base_url, ) elif provider == "azure_openai": if not kwargs.get("base_url", ""): base_url = os.getenv("AZURE_OPENAI_ENDPOINT", "") else: base_url = kwargs.get("base_url") return AzureChatOpenAI( model=kwargs.get("model_name", "gpt-4o"), temperature=kwargs.get("temperature", 0.0), api_version="2024-05-01-preview", azure_endpoint=base_url, api_key=api_key, ) elif provider == "openrouter": if not kwargs.get("base_url", ""): base_url = os.getenv("OPENROUTER_ENDPOINT", "") else: base_url = kwargs.get("base_url") model_name = kwargs.get("model_name", "openai/o3-mini-high") if "r1" in model_name or "aion" in model_name: return DeepSeekR1ChatOpenAI( model=model_name, temperature=kwargs.get("temperature", 0.0), base_url=base_url, api_key=api_key, ) else: return ChatOpenAI( model=model_name, temperature=kwargs.get("temperature", 0.0), base_url=base_url, api_key=api_key, ) else: raise ValueError(f"Unsupported provider: {provider}") def encode_image(img_path): if not img_path: return None with open(img_path, "rb") as fin: image_data = base64.b64encode(fin.read()).decode("utf-8") return image_data def get_latest_files( directory: str, file_types: list = [".webm", ".zip"] ) -> Dict[str, Optional[str]]: """Get the latest recording and trace files""" latest_files: Dict[str, Optional[str]] = {ext: None for ext in file_types} if not os.path.exists(directory): os.makedirs(directory, exist_ok=True) return latest_files for file_type in file_types: try: matches = list(Path(directory).rglob(f"*{file_type}")) if matches: latest = max(matches, key=lambda p: p.stat().st_mtime) # Only return files that are complete (not being written) if time.time() - latest.stat().st_mtime > 1.0: latest_files[file_type] = str(latest) except Exception as e: print(f"Error getting latest {file_type} file: {e}") return latest_files async def capture_screenshot(browser_context): """Capture and encode a screenshot""" # Extract the Playwright browser instance playwright_browser = ( browser_context.browser.playwright_browser ) # Ensure this is correct. # Check if the browser instance is valid and if an existing context can be reused if playwright_browser and playwright_browser.contexts: playwright_context = playwright_browser.contexts[0] else: return None # Access pages in the context pages = None if playwright_context: pages = playwright_context.pages # Use an existing page or create a new one if none exist if pages: active_page = pages[0] for page in pages: if page.url != "about:blank": active_page = page else: return None # Take screenshot try: screenshot = await active_page.screenshot(type="jpeg", quality=75, scale="css") encoded = base64.b64encode(screenshot).decode("utf-8") return encoded except Exception as e: return None

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/deploya-labs/mcp-browser-use'

If you have feedback or need assistance with the MCP directory API, please join our Discord server