Web Analysis MCP

额外新增.md•1.23 KiB

## 删除 tavily 的相关逻辑. 新增如下逻辑: 1. 通过searxng搜索可能的信息来源链接 2. 通过llm过滤和主题无关的链接(或则你有更好的办法) 3. 然后通过 `python creeper.py --urls "URL1,URL2"`(查看/home/lyf/workspaces/creeper中的具体使用)爬取过滤后的网页链接； 4. 对爬取到的网页内容进行总结,判断某个网页的内容大小 - 如果内容太大则单独上传给llm进行总结, - 如果内容少于某个值, 则合并内容上传llm进行总结 5. 在所有网页都经过总结后, 合并所有结果再次传给llm生成最终的总结 ## 调整 SearXNG 过滤逻辑目前逻辑通过域名黑白名单来过滤 SearXNG 获取的网页链接；不太符合我的要求。 1. 通过llm判断这此次主题关键字的类型, 例如编程、军事、政治、历史等类型(在后续内容合并时有用) 2. 通过llm来判断主题关键字和网页的关联性(标题、简介、已有部分内容等已知数据<SearXNG查询得到的>) 来过滤, 关联高的保留、关联低的过滤掉 3. 尽量减少llmd的请求次数, 而且和总结服务的llm配置分开 4. 用独立的文件夹来保存提示词 5. 保留黑白域名的逻辑, 而且优先级最高

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/himly0302/web-analysis-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

额外新增.md•1.23 KiB