Japanese Text Analyzer

by Mistizz
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Enables direct execution of the MCP server from a GitHub repository, allowing users to run the text analyzer without local installation

Servidor MCP del analizador de texto japonés

Este es un servidor MCP que puede realizar análisis morfológicos de texto japonés. Mide y evalúa las características de las oraciones desde una perspectiva lingüística y es útil para proporcionar retroalimentación sobre la producción de oraciones.

función

  • Cuente la cantidad de caracteres en un texto japonés (la cantidad real de caracteres excluyendo espacios y saltos de línea)
  • Cuente el número de palabras en un texto japonés
  • Análisis detallado de las características lingüísticas de los textos japoneses (longitud promedio de las oraciones, proporción de partes del discurso, diversidad de vocabulario, etc.)
  • Admite tanto la ruta de archivo como la entrada de texto directa
  • Resolución flexible de ruta de archivo (se puede buscar solo la ruta absoluta, la ruta relativa o el nombre del archivo)

Herramientas

Actualmente se encuentran implementadas las siguientes herramientas:

contar_caracteres

Mide el número de caracteres de un archivo. Especifique una ruta absoluta (se acepta el estilo Windows C:\Users... o el estilo WSL/Linux /c/Users/...). Cuenta el número real de caracteres excluyendo espacios y saltos de línea.

aporte:

  • filePath (cadena): la ruta al archivo en el que se contarán caracteres (preferiblemente la ruta absoluta de Windows o WSL/Linux).

producción:

  • Número de caracteres en el archivo (número real de caracteres excluyendo espacios y saltos de línea)

contar_palabras

Cuente las palabras en un archivo. Especifique una ruta absoluta (se acepta el estilo Windows C:\Users... o el estilo WSL/Linux /c/Users/...). En inglés cuenta las palabras separadas por espacios, en japonés utiliza el análisis morfológico.

aporte:

  • filePath (cadena): la ruta al archivo en el que se contarán las palabras (preferiblemente la ruta absoluta de Windows o WSL/Linux).
  • language (cadena, opcional, predeterminado: "en"): idioma del archivo (en: inglés, ja: japonés)

producción:

  • Recuento de palabras del archivo
  • En el modo japonés, también se muestran los resultados detallados del análisis morfológico.

contar_caracteres_del_portapapeles

Mide el número de caracteres de un texto. Cuenta el número real de caracteres excluyendo espacios y saltos de línea.

aporte:

  • text (cadena): el texto en el que se contarán los caracteres.

producción:

  • Número de caracteres en el texto (número real de caracteres excluyendo espacios y saltos de línea)

contar_palabras_del_portapapeles

Contar el número de palabras de un texto. En inglés cuenta las palabras separadas por espacios, en japonés utiliza el análisis morfológico.

aporte:

  • text (cadena): el texto en el que se contarán las palabras.
  • language (cadena, opcional, predeterminado: "en"): Idioma del texto (en: inglés, ja: japonés).

producción:

  • Número de palabras en el texto
  • En el modo japonés, también se muestran los resultados detallados del análisis morfológico.

analizar_texto

Realiza un análisis detallado de las características morfológicas y lingüísticas del texto. Analizamos la complejidad de las oraciones, la proporción de las partes del discurso, la diversidad de vocabulario y más.

aporte:

  • text (cadena): El texto a analizar.

producción:

  • Información básica sobre el texto (número total de caracteres, número de oraciones, número total de morfemas)
  • Resultados del análisis detallado (longitud promedio de las oraciones, proporción de partes del discurso, proporción de tipos de caracteres, diversidad de vocabulario, etc.)

analizar_archivo

Realiza un análisis morfológico y lingüístico detallado del expediente. Analizamos la complejidad de las oraciones, la proporción de las partes del discurso, la diversidad de vocabulario y más.

aporte:

  • filePath (cadena): la ruta al archivo a analizar (preferiblemente una ruta absoluta en formato Windows o WSL/Linux).

producción:

  • Información básica sobre el archivo (número total de caracteres, número de frases, número total de morfemas)
  • Resultados del análisis detallado (longitud promedio de las oraciones, proporción de partes del discurso, proporción de tipos de caracteres, diversidad de vocabulario, etc.)

Cómo utilizar

Ejecutando con npx

Este paquete se puede ejecutar con npx directamente desde el repositorio de GitHub:

npx -y github:Mistizz/mcp-JapaneseTextAnalyzer

Usar con Claude para escritorio

Agregue lo siguiente a su archivo de configuración de Claude for Desktop:

Ventanas: %AppData%\Claude\claude_desktop_config.json

macOS: ~/Library/Application Support/Claude/claude_desktop_config.json

{ "mcpServers": { "JapaneseTextAnalyzer": { "command": "npx", "args": [ "-y", "github:Mistizz/mcp-JapaneseTextAnalyzer" ] } } }

Usar con cursor

Para el cursor, agregue la misma configuración al archivo mcp.json en la carpeta .cursor .

Windows: %USERPROFILE%\.cursor\mcp.json

macOS/Linux: ~/.cursor/mcp.json

Configuración común (funciona en la mayoría de los entornos):

{ "mcpServers": { "JapaneseTextAnalyzer": { "command": "npx", "args": [ "-y", "github:Mistizz/mcp-JapaneseTextAnalyzer" ] } } }

Si lo anterior no funciona en Windows, intente lo siguiente:

{ "mcpServers": { "JapaneseTextAnalyzer": { "command": "cmd", "args": [ "/c", "npx", "-y", "github:Mistizz/mcp-JapaneseTextAnalyzer" ] } } }

Ejemplo de uso

Contar caracteres directamente en el texto

このテキストの文字数を数えてください。

Contar el número de palabras en un archivo en modo japonés

C:\path\to\your\file.txt の単語数を日本語モードで数えてください。

Contar palabras en una ruta de estilo WSL/Linux

/c/Users/username/Documents/file.txt の単語数を日本語モードで数えてください。

Contar palabras solo en el nombre del archivo

README.md の単語数を英語モードで数えてください。

Pegar texto y contar palabras en japonés

次のテキストの日本語の単語数を数えてください: 吾輩は猫である。名前はまだ無い。どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。

Analizar características lingüísticas detalladas del texto.

次のテキストを詳細に分析してください: 私は昨日、新しい本を買いました。とても面白そうな小説で、友人からの評判も良かったです。今週末にゆっくり読む予定です。

Analizar las características lingüísticas detalladas del archivo.

C:\path\to\your\file.txt を詳細に分析してください。

Función de resolución de ruta de archivo

Esta herramienta tiene la flexibilidad de encontrar archivos cuando se especifica una ruta de archivo:

  1. Si se especifica una ruta absoluta, se utiliza tal cual.
    • Ruta absoluta en formato de Windows (p. ej. C:\Users\username\Documents\file.txt )
    • Ambas rutas absolutas de estilo WSL/Linux (por ejemplo, /c/Users/username/Documents/file.txt ) se detectan y convierten automáticamente.
  2. Resolver rutas relativas en función del directorio actual (directorio de trabajo)
  3. Búsqueda basada en el directorio de inicio ( %USERPROFILE% o $HOME )
  4. Búsqueda basada en el directorio del escritorio
  5. Buscar por directorio de documentos

Esto significa que incluso si simplemente especifica un nombre de archivo como "README.md", lo buscará automáticamente en varios directorios comunes y lo usará si lo encuentra. Además, las rutas obtenidas del entorno WSL, Git Bash, etc. (en el formato /c/Users/... ) se pueden utilizar tal cual en el entorno de Windows.

Bajo el capó

Esta herramienta utiliza una biblioteca de análisis morfológico llamada "kuromoji.js" para contar el número de palabras japonesas. El análisis morfológico es un proceso básico en el procesamiento del lenguaje natural que divide las oraciones en las unidades más pequeñas de significado (morfemas).

El proceso de análisis morfológico puede tardar algún tiempo en inicializarse. En particular, puede llevar algún tiempo la primera vez que lo ejecute, ya que necesita cargar datos del diccionario. Al inicializar el analizador morfológico cuando se inicia el servidor, se minimizan los retrasos cuando se ejecuta la herramienta.

Análisis de rasgos lingüísticos

Las herramientas 'analyze_text' y 'analyze_file' calculan varias características lingüísticas de un texto basándose en los resultados del análisis morfológico. Estos incluyen métricas como:

  • Longitud promedio de la oración : el número promedio de caracteres por oración. Cuanto mayor sea este valor, más difícil puede ser leer el texto.
  • Morfemas por oración : el número promedio de morfemas por oración. Indica la densidad de oraciones y la complejidad sintáctica.
  • Partes del discurso : muestra la proporción de partes del discurso (sustantivos, verbos, adjetivos, etc.) utilizadas en el texto.
  • Proporciones de partículas : muestra con qué frecuencia se utilizan ciertas partículas y analiza la estructura y el flujo de las oraciones.
  • Proporción de tipos de caracteres : muestra la proporción de composición de caracteres hiragana, katakana, kanji y alfanuméricos.
  • Diversidad léxica : una medida de riqueza de vocabulario que muestra la relación entre palabras diferentes y el número total de palabras (relación tipos/tokens).
  • Proporción de palabras katakana : indica la frecuencia de uso de palabras katakana, lo que refleja la prevalencia de palabras extranjeras y términos técnicos, y la informalidad del estilo de escritura.
  • Frecuencia del lenguaje honorífico : indica con qué frecuencia se utilizan expresiones honoríficas y mide qué tan educado o formal es el texto.
  • Número promedio de signos de puntuación : el número promedio de signos de puntuación por oración proporciona una indicación de la división y legibilidad de la oración.

Combinando estos indicadores, podemos analizar las características de un texto desde múltiples ángulos y evaluar su estilo de escritura, legibilidad, pericia, etc.

licencia

Este servidor MCP se proporciona bajo la licencia MIT. Esto significa que usted es libre de usar, modificar y distribuir el software, sujeto a los términos de la licencia MIT. Para obtener más información, consulte el archivo LICENCIA en el repositorio del proyecto.

ID: a84hu4w43w