Skip to main content
Glama

Dingo MCP Server

by MigoXLab
artimuse_zh.md7.47 kB
# 文案 # 替你们试过了,nano banana 很能打——用Dingo × ArtiMuse 做一次“审美盲检”   最近大家都在玩 nano banana 的出图能力,我们也上手了一把。但我们不只看“能不能生图”,更在意“这图到底好不好看、为什么好看”。   于是我们的小队把它当做了一个样本工厂——先用 nano banana 生成一批不同风格的图片,再交给 ArtiMuse 给出总分 + 8 维点评,由 Dingo 把这一整套评测流程编排起来、统一阈值判定、最后出一页好懂的可视化报告。 为什么用Dingo × ArtiMuse?   ArtiMuse 本质上是个“会看图、会讲理”的审美引擎——不是给完一个总分就溜了,而是把一张图拆成八个角度来解释:构图、视觉元素、技术执行、原创性、主题表达、情绪反应、完形成闭到综合评估。看完分数,用户就能顺着这些维度去下手:哪里要裁、哪里要减元素、哪里要把细节抠出来,一清二楚。为了让“会讲理”这件事靠谱,我们做了一个一万张规模的 ArtiMuse-10K,摄影、绘画、设计到 AIGC 都覆盖,每张图都有经验评审给了总分和八维标注,题材和风格都够杂,所以学出来不挑食,泛化更稳。打分这块我们没走“分档→映射”的老路,而是把分数当连续值来学(可以理解成 Token-as-Score 的思路),好处是稳定、可重复、能分清那些细微但关键的差别。实际对比下来,ArtiMuse 在常见美学数据集上的相关性更高,而且最关键的是不只告诉用户分数,还能把得到这个分数的原因讲明白,选图、复盘、质检都能实现轻松推进。 [ArtiMuse 二维码(本地)](../../../../../artimuse/ArtiMuse/assets/images/QRcode.jpg)   落到工程实践里,就轮到 Dingo 把这套“懂审美”的能力变成一条顺滑的流水线:图片喂进来,内置的 RuleImageArtimuse 通过 HTTP 先创建任务再按节奏轮询状态,任务完成就取回 score_overall,用本地的门槛(默认 6)统一判 Good/Bad,同时把服务端的细粒度 data 原样写进 reason,后面做报告展示和问题追溯都有据可查。需要更全面的时候,Dingo 还能把别的规则一并拉起来跑,比如宽高比大于 4 或小于 0.25 直接判无效尺寸,清晰度用 NIMA(常用门槛 5.5),重复检测走 PHash 加 CNN,图文相关性用 CLIP 做打分(也可以换成句级嵌入更稳)。这样一套下来,你拿到的不只是一个分,还有成体系的证据链和可执行的改进方向——标准对齐了,流程固定了,协作也更少扯皮。 [本地文件](../assets/dingo-logo.png)   话不多说,来看看这波随堂测试的成绩。结果很直观:共 20 张样本,默认阈值 6 分;通过 15 张(75%)、拦下 5 张;端到端约 2 分 06 秒跑完一批,平均 ≈6.3 秒/张(主要是轮询节奏保守)。高分样本普遍有“主体明确、光影自然、细节保真、叙事清晰”的共性;被判低分的,大多是贴纸/Logo 占画面过大、过度风格化导致细节丢失、或构图过平导致视觉张力不足。 让我们通过一些“典型案例”,来看看如何来度量每一张图的好坏吧! 首先映入眼帘的,是夜光中的城市 ![夜光中的城市](https://openxlab.oss-cn-shanghai.aliyuncs.com/artimuse/dingo/nano/city.png)   它的总分为 7.73。我们的artimuse给出的评价是:它的画面层次和动线非常清晰:街道与建筑把视线稳稳引向画面中心,灯牌与反射撑起了氛围感;技术上曝光、清晰度都在线,霓虹与湿路的反光细节拉满。小瑕疵是热点略亮,若再压一点高光,完整度会更高。 然后我们看到了一位手工艺品的匠人老爷爷 ![手工艺品的匠人老爷爷](https://openxlab.oss-cn-shanghai.aliyuncs.com/artimuse/dingo/nano/photorealistic_example.png)   这幅图得到了7.42的高分。暖光打在工匠与器物上,构图稳、故事立,背景的陶器虚而不乱,整体非常耐看。在artimuse看来,这张图片不仅主题表达表现不错,同时技术执行也做得十分不错,它对焦精准、细节丰富、色调统一;唯一的小小缺憾在于“原创性”,题材偏传统,惊喜感略少。 第三张和第四张就是一些表现欠佳的图片了。 ![贴纸小熊](https://openxlab.oss-cn-shanghai.aliyuncs.com/artimuse/dingo/nano/red_panda_sticker.png)   先贴一张超可爱的贴纸小熊在你的桌面~它的总分是 4.82。它并非画质差,相反线条干净、细节清楚,但问题在视觉张力与完形:构图过平、层次单薄、装饰感强于叙事,导致“看着可爱,但审美深度不够”。如果是要做表情贴是完全没有问题的,但放在审美评分里,非常可惜,就容易吃亏。 最后的例图就是一张纯 Logo的极简图形 ![纯 Logo的极简图形](https://openxlab.oss-cn-shanghai.aliyuncs.com/artimuse/dingo/nano/logo.png)   它获得的总分是 5.68。功能性很强、识别度也没问题,但在“原创性、情绪感染与整体艺术性”上自然拿不到高分——这类图在“质检/合规”场景里 OK,可如果作为一张“好看精选图”,那么就有一些不占优势。   如果你也想把“凭感觉选图”升级成“有标准的选图”,这套组合的逻辑其实很简单:ArtiMuse 先把每张图拆成 8 个维度给出理由和分数,再把总分回填给 Dingo;Dingo 这边统一用一个阈值做 Good/Bad 的门槛(默认 6,可一键调整),还支持把尺寸有效性、清晰度(NIMA)、重复度、图文相关性这些规则并行拉起来,一次性出“多维体检卡”。我们自己的感受是:选图效率和沟通成本直线下降——尤其在团队需要统一审美标准的时候。   对于一些具体的参数,在这里小编也给个参考:对外展示、品牌上线时建议把门槛调到 6.5–7,宁缺毋滥;内容生产/日更选图可以放在 5.8–6.2,效率与质量折中;教学或创作迭代则用 5.5–6,保留更多边缘样本来“反向练”。如果你更追求时效,也可以把轮询间隔从 5 秒收紧到 2–3 秒,再配一个 90 秒的上限,整批用时会明显压缩。 最后留一个小清单,方便对号入座: - 想做内容上线门禁/品牌质检:Dingo 里开 ArtiMuse + 清晰度/尺寸/重复/相关性四件套,报表一页搞定; - 想做大批量选图:把阈值先设 6,Good 先发,Bad 留作人工复核或改图清单; - 想做创作提升/教学反馈:多看 ArtiMuse 的维度点评摘录,按“构图/光影/元素删减/叙事”四步复盘,进步很快。 立即复现(开源仓库):Dingo(GitHub)https://github.com/MigoXLab/dingo | ArtiMuse(GitHub)https://github.com/thunderbolt215/ArtiMuse   样图来源注明一下:上面的示例由 nano banana 生成/编辑,仅用于技术评测。想拿到我们这次的评测模板、规则配置和示例脚本,评论或私信「Dingo 评图」,我把可复现素材包发给你。我们也会持续更新更多风格的对比结果(比如“人物一致性”“多图融合”“产品演示”),把“好看”真正变成你团队的一条流水线。

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/MigoXLab/dingo'

If you have feedback or need assistance with the MCP directory API, please join our Discord server