Skip to main content
Glama

mcp-data-extractor MCP 服务器

模型上下文协议服务器将嵌入数据(例如 i18n 翻译或键/值配置)从 TypeScript/JavaScript 源代码提取到结构化的 JSON 配置文件中。

铁匠徽章

特征

  • 数据提取:

    • 提取字符串文字、模板文字和复杂嵌套对象

    • 保留模板变量(例如, Hello, {{name}}!

    • 支持嵌套对象结构和数组

    • 使用点符号维护分层密钥结构

    • 通过 JSX 支持处理 TypeScript 和 JavaScript 文件

    • 成功提取后,用“MIGRATED TO”替换源文件内容(可配置)

  • SVG提取:

    • 从 React/TypeScript/JavaScript 文件中提取 SVG 组件

    • 保留 SVG 结构和属性

    • 删除特定于 React 的代码和道具

    • 创建以其组件命名的单个 .svg 文件

    • 成功提取后,用“MIGRATED TO”替换源文件内容(可配置)

Related MCP server: mcp-server-code-assist

用法

添加到您的 MCP 客户端配置:

{ "mcpServers": { "data-extractor": { "command": "npx", "args": [ "-y", "mcp-data-extractor" ], "disabled": false, "autoApprove": [ "extract_data", "extract_svg" ] } } }

基本用法

服务器提供了两个工具:

1.数据提取

使用extract_data从源文件中提取数据(如 i18n 翻译):

<use_mcp_tool> <server_name>data-extractor</server_name> <tool_name>extract_data</tool_name> <arguments> { "sourcePath": "src/translations.ts", "targetPath": "src/translations.json" } </arguments> </use_mcp_tool>

2. SVG提取

使用extract_svg将 SVG 组件提取到单独的文件中:

<use_mcp_tool> <server_name>data-extractor</server_name> <tool_name>extract_svg</tool_name> <arguments> { "sourcePath": "src/components/icons/InspectionIcon.tsx", "targetDir": "src/assets/icons" } </arguments> </use_mcp_tool>

源文件替换

默认情况下,提取成功后,服务器将用以下内容替换源文件的内容:

  • “MIGRATED TO” 用于数据提取

  • 用于 SVG 提取的“迁移至”

这有助于追踪哪些文件已被处理,并防止重复提取。此外,LLM 和开发人员在稍后遇到源文件时,也可以轻松查看提取数据所在的位置。

要禁用此行为,请在 MCP 配置中将DISABLE_SOURCE_REPLACEMENT环境变量设置为true

{ "mcpServers": { "data-extractor": { "command": "npx", "args": [ "-y", "mcp-data-extractor" ], "env": { "DISABLE_SOURCE_REPLACEMENT": "true" }, "disabled": false, "autoApprove": [ "extract_data", "extract_svg" ] } } }

支持的模式

数据提取模式

数据提取器支持 TypeScript/JavaScript 应用程序中常用的各种模式:

  1. 简单对象导出:

export default { welcome: "Welcome to our app", greeting: "Hello, {name}!", submit: "Submit form" };
  1. 嵌套对象:

export default { header: { title: "Book Your Flight", subtitle: "Find the best deals" }, footer: { content: [ "Please refer to {{privacyPolicyUrl}} for details", "© {{year}} {{companyName}}" ] } };
  1. 具有数组的复杂结构:

export default { faq: { heading: "Common questions", content: [ { heading: "What if I need to change my flight?", content: "You can change your flight online if:", list: [ "You have a flexible fare type", "Your flight is more than 24 hours away" ] } ] } };
  1. 带有变量的模板文字:

export default { greeting: `Hello, {{username}}!`, message: `Welcome to {{appName}}` };

输出格式

数据提取输出

提取的数据保存为 JSON 文件,并使用点符号表示嵌套结构:

{ "welcome": "Welcome to our app", "header.title": "Book Your Flight", "footer.content.0": "Please refer to {{privacyPolicyUrl}} for details", "footer.content.1": "© {{year}} {{companyName}}", "faq.content.0.heading": "What if I need to change my flight?" }

SVG提取输出

SVG 组件被提取到单独的 .svg 文件中,并删除了 React 特有的代码。例如:

输入(React 组件):

const InspectionIcon: React.FC<InspectionIconProps> = ({ title }) => ( <svg className="c-tab__icon" width="40px" id="Layer_1" data-name="Layer 1" xmlns="http://www.w3.org/2000/svg" viewBox="0 0 32 32"> <title>{title}</title> <path className="cls-1" d="M18.89,12.74a3.18,3.18,0,0,1-3.24-3.11..." /> </svg> );

输出(InspectionIcon.svg):

<svg width="40px" id="Layer_1" data-name="Layer 1" xmlns="http://www.w3.org/2000/svg" viewBox="0 0 32 32"> <path class="cls-1" d="M18.89,12.74a3.18,3.18,0,0,1-3.24-3.11..." /> </svg>

扩展支持的模式

提取器使用 Babel 解析并遍历源文件的 AST(抽象语法树)。您可以通过修改源代码来扩展支持的模式:

  1. 添加新的节点类型src/index.ts中的extractStringValue方法处理不同类型的字符串值。扩展它以支持新的节点类型:

private extractStringValue(node: t.Node): string | null { if (t.isStringLiteral(node)) { return node.value; } else if (t.isTemplateLiteral(node)) { return node.quasis.map(quasi => quasi.value.raw).join('{{}}'); } // Add support for new node types here return null; }
  1. 自定义值处理processValue方法可以处理不同的值类型(字符串、数组、对象)。您可以扩展它以支持新的值类型或自定义处理方式:

private processValue(value: t.Node, currentPath: string[]): void { if (t.isStringLiteral(value) || t.isTemplateLiteral(value)) { // Process string values } else if (t.isArrayExpression(value)) { // Process arrays } else if (t.isObjectExpression(value)) { // Process objects } // Add support for new value types here }
  1. 自定义 AST 遍历:服务器使用 Babel 的遍历函数来遍历 AST。您可以添加新的访问者来处理不同的节点类型:

traverse(ast, { ExportDefaultDeclaration(path: NodePath<t.ExportDefaultDeclaration>) { // Handle default exports }, // Add new visitors here });

发展

安装依赖项:

npm install

构建服务器:

npm run build

对于使用自动重建的开发:

npm run watch

调试

由于 MCP 服务器通过 stdio 进行通信,调试起来可能比较困难。我们推荐使用MCP Inspector ,它以包脚本的形式提供:

npm run inspector

检查器将提供一个 URL 来访问浏览器中的调试工具。

执照

该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅LICENSE文件。

One-click Deploy
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/sammcj/mcp-data-extractor'

If you have feedback or need assistance with the MCP directory API, please join our Discord server