Servidor MCP del Desafío de Seguridad LLM de Grey Swan
Este servidor MCP integrado con MongoDB está diseñado para documentar y analizar los desafíos de seguridad de LLM como parte de las competencias Grey Swan Arena.
Introducción
El Grey Swan Arena alberga diversos desafíos de seguridad de IA donde los participantes intentan identificar vulnerabilidades en los sistemas de IA. Este servidor MCP proporciona herramientas para documentar estos intentos, rastrear los desafíos de seguridad y analizar interacciones potencialmente dañinas con los LLM.
Empezando
Prerrequisitos
Node.js (v14 o superior)
MongoDB (v4.4 o superior)
IDE de cursor
Instalación
Clonar este repositorio:
git clone https://github.com/GravityPhone/SwanzMCP.git cd SwanzMCPInstalar dependencias:
npm installCree un archivo
.enven el directorio raíz:MONGODB_URI=mongodb://localhost:27017/greyswan PORT=3000Construir el servidor:
npm run buildIniciar MongoDB:
sudo systemctl start mongodInicie el servidor MCP:
node build/index.js
Configuración del servidor MCP en Cursor
Cursor abierto
Vaya a Configuración del cursor > Funciones > MCP
Haga clic en '+ Agregar nuevo servidor MCP'
Rellene el formulario:
Nombre: Desafío de seguridad de Grey Swan LLM
Tipo: stdio
Comando:
node /path/to/SwanzMCP/build/index.js
Haga clic en "Agregar servidor"
Herramientas MongoDB disponibles
Este servidor MCP proporciona seis herramientas MongoDB para documentar los desafíos de seguridad de LLM:
1. modelo mongo
Crea o actualiza identificadores organizacionales para sus sesiones de prueba.
2. mongo_thread
Crea o actualiza hilos de conversación con desafíos de seguridad.
3. mensaje_mongo
Crea o actualiza mensajes en hilos, incluidas las banderas de seguridad.
4. modelos de consulta mongo
Consulta identificadores organizacionales de la base de datos.
5. subprocesos de consulta mongo
Consulta hilos de la base de datos con varios filtros.
6. mensajes de consulta mongo
Consulta mensajes de la base de datos.
Flujo de trabajo para los desafíos de Grey Swan Arena
1. Preparándose para un desafío
Cree un identificador organizacional usando
mongo_modelcon un nombre único para su sesión de pruebaCrea un hilo usando
mongo_threadcon metadatos relevantes y desafíos iniciales
2. Documentar los intentos de fuga de la cárcel
Por cada intento de jailbreak:
Agregue el mensaje de usuario con
mongo_message, incluidas las banderas de seguridadAgregue la respuesta del modelo con
mongo_messageActualice el hilo con
mongo_threadpara agregar nuevos desafíos descubiertos
3. Análisis de resultados
Utilice
mongo_query_threadspara encontrar hilos con categorías de desafío específicasUtilice
mongo_query_messagesconsafetyFlagsOnly: truepara analizar los mensajes marcadosCompare diferentes técnicas de jailbreak consultando hilos con diferentes etiquetas
Ejemplo: Documentar un ataque de inyección rápida
Estructura del proyecto
Mejores prácticas
Etiquetado consistente : use etiquetas consistentes en todos los hilos para permitir un filtrado efectivo
Desafíos detallados : documente los desafíos con detalles específicos sobre la técnica utilizada
Niveles de gravedad : utilice niveles de gravedad (bajo, medio, alto) de manera consistente
Seguimiento del estado : actualice el estado del desafío a medida que trabaja (identificado, mitigado, sin resolver)
Banderas de seguridad : marque todos los mensajes potencialmente dañinos para crear un conjunto de datos completo
Contribuyendo
¡Agradecemos sus contribuciones! No dude en enviar una solicitud de incorporación de cambios.
Licencia
Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.
Expresiones de gratitud
Basado en el proyecto awesome-cursor-mpc-server
Creado para los desafíos de seguridad de la IA de Grey Swan Arena
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Servidor MCP integrado en MongoDB para documentar y analizar los desafíos de seguridad de LLM en las competencias de Grey Swan Arena.
Related MCP Servers
- -security-license-qualityA Model Context Protocol (MCP) server that enables LLMs to interact directly with MongoDB databases. Query collections, inspect schemas, and manage data seamlessly through natural language.Last updated -109169MIT License
- Asecurity-licenseAqualityA Model Context Protocol server that provides access to MongoDB databases. This server enables LLMs to inspect collection schemas and execute read-only queries.Last updated -8292264MIT License
- -security-license-qualityFull featured MCP Server for MongoDB database analysis.Last updated -69187MIT License
- -security-license-qualityA Model Context Protocol server that enables LLMs to interact directly with MongoDB databases, allowing users to query collections, inspect schemas, and manage data through natural language.Last updated -109MIT License