# === SearXNG 搜索配置(必需) ===
# SearXNG 实例地址
SEARXNG_BASE_URL=http://127.0.0.1:8086
# SearXNG 请求超时(毫秒,默认 10 秒)
# SEARXNG_TIMEOUT=10000
# === Creeper 爬虫配置(必需) ===
# Creeper 项目路径(包含 creeper.py)
CREEPER_PATH=/home/lyf/workspaces/creeper
# Python 解释器路径(默认 python)
# CREEPER_PYTHON=python
# 并发数(默认 5)
# CREEPER_CONCURRENCY=5
# 爬取超时(毫秒,默认 60 秒)
# CREEPER_TIMEOUT=60000
# === 过滤器配置(可选) ===
# 过滤后保留的最大结果数(默认 8)
# FILTER_MAX_RESULTS=8
# 域名黑名单(逗号分隔)
# DOMAIN_BLACKLIST=pinterest.com,facebook.com,instagram.com
# 域名白名单(逗号分隔,优先保留)
# DOMAIN_WHITELIST=github.com,stackoverflow.com,docs.python.org
# === LLM 过滤配置(可选) ===
# 是否启用 LLM 智能过滤(默认 false)
# FILTER_LLM_ENABLED=false
# LLM 过滤服务的 API Key(独立于总结服务)
# FILTER_LLM_API_KEY=sk-your-filter-api-key
# LLM 过滤服务的 API 地址
# FILTER_LLM_BASE_URL=https://api.deepseek.com
# LLM 过滤使用的模型(可用轻量模型)
# FILTER_LLM_MODEL=deepseek-chat
# LLM 过滤请求超时(毫秒,默认 30 秒)
# FILTER_LLM_TIMEOUT=30000
# === Map-Reduce 总结配置(可选) ===
# 触发 Map-Reduce 的内容阈值(默认 50KB)
# MAP_REDUCE_THRESHOLD=50000
# 每个 chunk 的最大字符数(默认 30KB)
# MAP_REDUCE_CHUNK_SIZE=30000
# Map 阶段最大并发数(默认 5)
# MAP_REDUCE_MAX_CONCURRENCY=5
# === LLM 总结服务配置(必需) ===
# 方式1: DeepSeek 官方 API
SUMMARY_API_KEY=sk-your-deepseek-key-here
SUMMARY_BASE_URL=https://api.deepseek.com
SUMMARY_MODEL=deepseek-chat
# 方式2: ModelScope API (推荐)
# SUMMARY_API_KEY=ms-your-modelscope-key-here
# SUMMARY_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode
# SUMMARY_MODEL=deepseek-ai/DeepSeek-V3.2-Exp
# LLM 其他配置(可选)
SUMMARY_MAX_TOKENS=4096
SUMMARY_TIMEOUT=120000 # 超时时间(毫秒),默认 120 秒
SUMMARY_MAX_RETRIES=2 # 最大重试次数,默认 2 次
# === 服务配置(可选) ===
# 单次总结触发阈值(字符数,默认 50KB)
MAX_CONTENT_LENGTH=50000
# 缓存 TTL(秒,默认 1 小时)
CACHE_TTL=3600
# 日志级别:debug, info, warn, error
LOG_LEVEL=info