Whichmodel-mcp
whichmodel-mcp
Консультант по выбору моделей для автономных агентов — получайте рекомендации по LLM с оптимизацией затрат через MCP.
whichmodel.dev отслеживает цены и возможности более 100 моделей LLM, обновляя данные каждые 4 часа. Этот MCP-сервер предоставляет эти данные, чтобы ИИ-агенты могли выбирать подходящую модель по лучшей цене для каждой задачи.
MCP Endpoint
https://whichmodel.dev/mcpТранспорт: Streamable HTTP (спецификация MCP 2025-03-26)
Быстрый старт
Добавьте в конфигурацию вашего MCP-клиента:
{
"mcpServers": {
"whichmodel": {
"url": "https://whichmodel.dev/mcp"
}
}
}API-ключ не требуется. Установка не нужна.
Stdio (локальные клиенты)
Для MCP-клиентов, использующих транспорт stdio (Claude Desktop, Cursor и т. д.):
{
"mcpServers": {
"whichmodel": {
"command": "npx",
"args": ["-y", "whichmodel-mcp"]
}
}
}Это запускает легкий локальный прокси-сервер, который перенаправляет запросы на удаленный сервер.
Инструменты
recommend_model
Получение рекомендации по модели с оптимизацией затрат для конкретного типа задачи, сложности и бюджета.
Параметр | Тип | Описание | ||
| enum (обязательно) |
| ||
|
|
|
| Сложность задачи (по умолчанию: |
| number | Ожидаемый объем входных данных в токенах | ||
| number | Ожидаемый объем выходных данных в токенах | ||
| number | Максимальные расходы в USD за вызов | ||
| object | Требования к возможностям: |
Возвращает: рекомендуемую модель, альтернативу, бюджетный вариант, оценку стоимости и обоснование.
compare_models
Прямое сравнение 2–5 моделей с дополнительными прогнозами затрат по объему.
Параметр | Тип | Описание |
| string[] (обязательно) | ID моделей, например |
| enum | Контекст для сравнения |
| object |
|
Возвращает: цены, возможности, уровни качества и прогнозируемые затраты для каждой модели.
get_pricing
Поиск необработанных данных о ценах с фильтрами по модели, провайдеру, ценовому потолку и возможностям.
Параметр | Тип | Описание |
| string | Конкретный ID модели |
| string | Фильтр по провайдеру, например |
| number | Максимальная цена за миллион входных токенов (USD) |
| string[] | Необходимые возможности: |
| number | Минимальное контекстное окно в токенах |
| number | Максимальное количество результатов (1–100, по умолчанию 20) |
check_price_changes
Просмотр изменений цен на модели с определенной даты.
Параметр | Тип | Описание |
| string (обязательно) | Дата в формате ISO, например |
| string | Фильтр по конкретной модели |
| string | Фильтр по конкретному провайдеру |
Возвращает: повышения цен, снижения, новые модели и устаревшие модели.
Интеграция с агентами
WhichModel разработан как инструмент по умолчанию в конвейерах автономных агентов. Добавьте его к любому агенту, чтобы он мог автоматически выбирать правильную модель по правильной цене для каждой подзадачи.
Системный промпт (скопировать и вставить)
Добавьте этот блок в системный промпт вашего агента:
You have access to the WhichModel MCP server for cost-aware model selection.
Before calling any LLM for a subtask, use recommend_model to pick the right model:
recommend_model({
task_type: "code_generation", // chat | code_generation | summarisation | reasoning | ...
complexity: "medium", // low | medium | high
estimated_input_tokens: 2000, // optional
estimated_output_tokens: 500, // optional
budget_per_call: 0.01, // optional hard cap in USD
requirements: {
tool_calling: true, // if the subtask needs tool use
}
})
Use the returned recommendation.model_id. The response includes cost_estimate and
reasoning so you can log why each model was chosen.Шаблоны промптов через MCP
Сервер предоставляет встроенные шаблоны промптов, которые можно получить через prompts/get:
Имя промпта | Вариант использования |
| Полный блок системного промпта для выбора модели с учетом затрат |
| Минимальный фрагмент для добавления в существующий системный промпт |
| Жесткое ограничение затрат на вызов (передайте аргумент |
Получение программным способом:
{ "method": "prompts/get", "params": { "name": "cost-aware-agent" } }Интеграции с фреймворками
LangChain:
langchain-whichmodel— цепочкаWhichModelRouterHaystack:
whichmodel-haystack— компонентWhichModelRouter
Актуальность данных
Данные о ценах обновляются каждые 4 часа из OpenRouter. Каждый ответ включает временную метку data_freshness, чтобы вы знали, насколько актуальны данные.
Ссылки
Веб-сайт: whichmodel.dev
MCP endpoint: https://whichmodel.dev/mcp
Discovery: https://whichmodel.dev/.well-known/mcp.json
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/Which-Model/whichmodel-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server