aigc-humanizer-zh
Provides tools for masking LaTeX formulas with placeholders before rewriting and restoring them afterwards, preventing LLM from altering mathematical content.
Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@aigc-humanizer-zh分析这段中文:基于机器学习方法,本文提出了一个创新模型。"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
AIGC Humanizer ZH
中文学术写作 AIGC 率降低工具 — 提供完整版(MCP Server,自动检测)和轻量版(Skill 文件,零依赖)两种形态
这是什么?
aigc-humanizer-zh 帮助你在不改动学术观点的前提下,系统性地降低中文学术文本的 AIGC 检测率。它基于真实论文改写实验(AIGC 率从 >50% 降至 11%)归纳的 16 种 AI 写作模式,提供检测 → 报告 → 改写指导 → 质量验证的完整链路。
项目提供两种形态,按需选用:
完整版(MCP Server) | 轻量版(Skill 文件) | |
文件 |
|
|
依赖 | Python 3.10+ / jieba / mcp | 零依赖 |
部署 | 配置 MCP 客户端 | 复制到 skills 目录即用 |
检测方式 | 正则引擎自动扫描,确定性强 | agent 自行理解规则并判断 |
AI 模式 | 16 种全覆盖 | 10 种核心高频模式 |
TTR 词汇丰富度 | ✓ jieba 分词自动计算 | ✗ |
60 分制评分 | ✓ 6 维度自动打分 | ✗(改为人眼判断清单) |
LaTeX 保护 | 栈式扫描器(嵌套安全) | 手动占位符规则 |
适用场景 | 批量处理、高精度需求 | 快速上手、临时使用 |
如何选择: 如果你已经配置了 DeepSeek TUI 或 Claude Desktop 的 MCP,用完整版获得自动检测能力;如果只是想快速试一下、或者环境受限,用轻量版 Skill 文件——加载后 agent 就能直接按规则执行改写。
快速开始
完整版(MCP Server)
# 1. 安装依赖
pip install -r requirements.txt
# 2. 启动服务(stdio 传输,供 MCP 客户端调用)
python server.py在 DeepSeek TUI 的 ~/.deepseek/config.toml 中配置:
[mcp_servers.aigc-humanizer]
command = "python"
args = ["/path/to/aigc-humanizer-zh/server.py"]轻量版(Skill 文件)
方式一:本地加载
/skill /path/to/humanizer-zh-light.md方式二:从 GitHub 加载
/skill https://raw.githubusercontent.com/shuohui-air-technology/aigc-humanizer-zh/main/humanizer-zh-light.md加载后,agent 即获得「逐段扫描 AI 痕迹 → 交互式改写 → 自检输出」的能力。
完整版 — 8 个 MCP 工具
核心流程工具
工具 | 功能 | 典型用途 |
| LaTeX 公式 → 占位符(栈式扫描) | 润色前保护公式,防止被 LLM 篡改 |
| TTR 词汇丰富度 + 违禁词拦截 | 快速初筛,违禁词命中即判定不通过 |
| 占位符 → 原始 LaTeX 公式 | 润色后无损还原 |
| 16 种模式扫描 + 7 项硬约束 | 深度风险分析,输出结构化报告 |
| 6 维度 60 分制质量评分 | 改写后效果验证(≥54 优秀 / ≥42 良好) |
| 生成结构化改写计划(SOP 6 步) | 指导 agent 按优先级改写 |
交互式逐段工具
工具 | 功能 | 典型用途 |
| 逐段输出 AIGC 评分 (0-100) + 模式命中 + | 支持用户逐段决策是否改写 |
| 为单段生成结构化改写 prompt(含原文、命中模式、文体约束) | agent 直接将 prompt 喂给 LLM 执行改写 |
交互式工具的详细用法见 WORKFLOW.md,包含可直接复制的 Agent Prompt 模板。
完整版 — 典型工作流
原始文本
│
▼ mask_latex()
骨架文本(公式→占位符)
│
▼ analyze_by_paragraph()
逐段 AIGC 评分 (0-100)
│
├── 段1: 12/100 🟢 → 跳过
├── 段2: 25/100 🟡 → 用户决定是否改写
├── 段3: 50/100 🔴 → build_rewrite_prompt() → LLM 改写 → 用户确认替换
└── ...
│
▼ assess_quality()
60 分制验证
│
▼ restore_latex()
最终文本(公式已还原)检测能力
16 种 AI 写作模式
ID | 模式 | 严重度 | 触发示例 | 完整版 | 轻量版 |
1 | 理论起笔 | 🔴 高 | 「依据社会建构主义理论……」 | ✓ | ✓ |
2 | 段末套路结尾 | 🔴 高 | 「此案例印证了……」 | ✓ | ✓ |
3 | 整齐编号逻辑 | 🟡 中 | 「首先……其次……再次……」 | ✓ | ✓ |
4 | 被动分析套话 | 🔴 高 | 「该处理体现了……」 | ✓ | ✓ |
5 | 模板化问题陈述 | 🟡 中 | 「面临的核心问题是……」 | ✓ | — |
6 | 三元并列对称 | 🟡 中 | 「理论上……实践上……方法上……」 | ✓ | ✓ |
7 | 段末冗余总结 | 🔴 高 | 「综上所述……由此可见……」 | ✓ | ✓ |
8 | 模糊归因 | 🔴 高 | 「专家认为……」(无出处) | ✓ | ✓ |
9 | 填充短语 | 🟢 低 | 「值得注意的是……」 | ✓ | ✓ |
10 | 泛化结论 | 🔴 高 | 「具有重要意义……前景广阔……」 | ✓ | ✓ |
11 | AI 高频词 | 🟡 中 | 「深刻揭示」「不可或缺」「综合运用」 | ✓ | ✓ |
12 | 回避系动词「是」 | 🟡 中 | 「作为……重要载体」「扮演着……角色」 | ✓ | — |
13 | 过度排比 | 🟡 中 | 「突破范式,填补空白,创新视角……」 | ✓ | — |
14 | 三步走结构 | 🟡 中 | 「从经济维度……社会维度……文化维度……」 | ✓ | — |
15 | 破折号密度异常 | 🟢 低 | 一段内 —— 超过 4 次 | ✓ | — |
16 | 正文加粗滥用 | 🟢 低 | 全文 ** 超过 5 处 | ✓ | — |
7 项硬约束
硬约束在完整版中由代码自动检测,命中即判定高风险;轻量版中由 agent 按清单人工核查。
# | 约束 | 阈值 | 违规后果 |
1 | AI 高频词密度 | 每段 > 2 个 | 高风险 |
2 | 段末总结套句 | 全文 > 1 处 | 高风险 |
3 | 整齐三元并列 | 每段 > 1 处 | 高风险 |
4 | 理论起笔占比 | > 20% 段落 | 高风险 |
5 | 正文加粗 | 全文 > 5 处 | 高风险 |
6 | 泛化结尾 | 全文 > 0 处 | 高风险 |
7 | 模糊归因 | 全文 > 0 处 | 高风险 |
60 分制质量评估(仅完整版)
维度 | 满分 | 评估要点 |
直接性 | 10 | 直接陈述 vs 绕圈宣告 |
节奏 | 10 | 句子长度变化,长短交替 |
真实性 | 10 | 是否像真实学者在说话 |
信息密度 | 10 | 每句话承载信息,无废话 |
学术规范 | 10 | 归因具体、限定合理、语域匹配 |
抗检测性 | 10 | 模式规律性是否被充分打破 |
评分标准:54-60 优秀 / 42-53 良好 / < 42 需修订。
轻量版(humanizer-zh-light.md)
轻量版是一个 248 行的纯文本 Skill 文件,专为以下场景设计:
不想安装 Python 依赖
只需要临时处理一两篇论文
在受限环境(如在线 notebook)中使用
想先体验规则效果,再决定是否部署完整版
包含内容
模块 | 内容 |
10 种核心 AI 模式 | 含触发词、改写示例、替换词表 |
6 项硬约束 | 简化自查清单 |
改写 SOP | 6 步优先级流程 |
噪声保留原则 | 避免过度均质化 |
LaTeX 保护规则 | 手动占位符方案 |
交互式改写流程 | 逐段扫描 → 用户决策 → 改写的完整指令 |
注入学者视角 | 4 种去「机器稿」的具体方法 |
输出自检清单 | 8 项核查 |
与完整版的差异
轻量版阉割了 6 种需要代码检测才能稳定识别、或在学术写作中出现频率较低的模式(模板化问题陈述、回避「是」、过度排比、三步走、破折号密度、加粗滥用)。TTR 和 60 分制评分改为人工判断清单。核心的交互式逐段改写流程完整保留。
工程结构
aigc-humanizer-zh/
│
├── server.py # MCP Server 入口(8 个 @mcp.tool())
│
├── src/ # 核心引擎
│ ├── scanner.py # LaTeX 栈式扫描器(嵌套安全,216 行)
│ ├── patterns.py # 16 种 AI 模式检测 + 7 项硬约束(623 行)
│ └── evaluator.py # TTR 评估 + 6 维度 60 分制质量评分(404 行)
│
├── humanizer-zh-light.md # 轻量版 Skill 文件(248 行,零依赖)
├── WORKFLOW.md # 交互式工作流完整文档 + Agent Prompt 模板
├── SKILL.md # 上游 humanizer-zh-academic skill 参考(占位)
│
├── pyproject.toml # Python 工程配置
├── requirements.txt # 依赖:mcp, jieba
├── README.md # 本文件
└── .gitignore参考来源
humanizer-zh-academic skill — 16 种 AI 模式、7 项硬约束、60 分制评估(554 行完整版)
Wikipedia: Signs of AI writing — WikiProject AI Cleanup 维护的英文 AI 写作模式分类框架
真实论文对比实验 — 同一论文 AI 润色版(AIGC >50%)与人工二次修改版(AIGC 11%)的逐段差异分析
de-AI-writing skill (OUBIGFA) — 硬约束数字化设计参考
Humanizer-zh (op7418) — 模式分类与质量评分框架参考
核心洞见:AI 写作的每一步都趋向统计最优,而人类写作的「不完美」恰恰是它最难伪造的特征。本项目所做的,就是帮助你系统性地恢复这些「不完美」。
许可证
MIT
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/shuohui-air-technology/aigc-humanizer-zh'
If you have feedback or need assistance with the MCP directory API, please join our Discord server