blackmount-nlp-mcp

PyPI version License: MIT Python 3.10+

NLP для MCP — без тяжелых зависимостей. Создано Blackmount.

45 инструментов для анализа текста в виде сервера FastMCP. Никаких NLTK. Никаких spaCy. Никаких трансформеров. Одна зависимость (mcp[cli]), менее 50 КБ кода NLP, готово к работе за секунды. Требуется Python 3.10+.

Зачем это нужно

	blackmount-nlp-mcp	NLTK	spaCy	transformers
Размер wheel	42 КБ	1.5 МБ	6 МБ+ (+ модели)	10 МБ+ (+ модели)
Прямые зависимости	1	много	много	много
Токенизация	✅	✅	✅	✅
Анализ тональности	✅	✅	❌	✅
Оценка читабельности	✅	❌	❌	❌
Извлечение ключевых слов	✅	✅	❌	❌
Сходство текстов	✅	✅	✅	✅
Определение языка	✅ (18 языков)	❌	❌	❌

Все реализовано с нуля на чистом Python — стеммер Портера, TF-IDF, RAKE, расстояние Левенштейна, анализ тональности в стиле VADER, индексы читабельности Флеша / Ганнинга-Фога / Коулмана-Лиау / ARI / SMOG, экстрактивная суммаризация, определение языка — плюс встроенный лексикон тональности из 2000+ слов и список из 500+ стоп-слов, включенные в пакет.

Быстрый старт

pip install blackmount-nlp-mcp

Claude Desktop

Добавьте в файл конфигурации:

macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Windows: %APPDATA%\Claude\claude_desktop_config.json
Linux: ~/.config/Claude/claude_desktop_config.json

{
  "mcpServers": {
    "nlp": {
      "command": "blackmount-nlp-mcp"
    }
  }
}

Cursor

Добавьте в .cursor/mcp.json в корне вашего проекта:

{
  "mcpServers": {
    "nlp": {
      "command": "blackmount-nlp-mcp"
    }
  }
}

Любой MCP-клиент

Сервер работает через stdio. Укажите клиенту команду blackmount-nlp-mcp:

blackmount-nlp-mcp

Перезапустите редактор. Все 45 инструментов NLP теперь доступны — просто спросите на естественном языке.

Каталог инструментов

Токенизация (4 инструмента)

Инструмент	Описание	Пример запроса
`word_tokenize`	Разбиение текста на слова с учетом сокращений и пунктуации	"Разбей этот абзац на слова"
`sentence_tokenize`	Разбиение на предложения с учетом распространенных аббревиатур	"Раздели этот текст на отдельные предложения"
`generate_ngrams`	Генерация n-грамм на уровне слов из списка токенов	"Сгенерируй биграммы из этих токенов"
`generate_char_ngrams`	Генерация n-грамм на уровне символов	"Получи триграммы символов для этого слова"

Читабельность (8 инструментов)

Инструмент	Описание	Пример запроса
`flesch_reading_ease`	Оценка легкости чтения 0–100 (выше = легче)	"Рассчитай индекс легкости чтения Флеша"
`flesch_kincaid_grade`	Оценка уровня образования в США	"Для какого уровня образования написан этот текст?"
`gunning_fog_index`	Индекс туманности на основе соотношения сложных слов	"Рассчитай индекс туманности для этого текста"
`coleman_liau_index`	Индекс уровня образования Коулмана-Лиау	"Получи оценку по Коулману-Лиау"
`automated_readability_index`	Индекс уровня образования ARI	"Какой ARI у этого документа?"
`smog_grade_index`	Индекс SMOG (рекомендуется для медицинских текстов)	"Рассчитай индекс SMOG для этого документа"
`count_syllables`	Оценка количества слогов в любом слове	"Сколько слогов в слове 'extraordinary'?"
`get_reading_level`	Все оценки читабельности в одном вызове с текстовой меткой	"Дай мне полный отчет о читабельности этого текста"

Анализ тональности (4 инструмента)

Инструмент	Описание	Пример запроса
`get_sentiment_score`	Составная оценка тональности от -1.0 до +1.0	"Какова тональность этого отзыва клиента?"
`get_sentiment_label`	Возвращает `positive`, `negative` или `neutral`	"Этот отзыв положительный или отрицательный?"
`get_sentence_sentiments`	Анализ тональности по предложениям	"Покажи мне тональность каждого предложения"
`get_aspect_sentiment`	Тональность по конкретным темам	"Какова тональность отзывов по теме 'цены'?"

Извлечение ключевых слов (4 инструмента)

Инструмент	Описание	Пример запроса
`extract_tfidf_keywords`	Ранжирование ключевых слов по TF-IDF в корпусе	"Какие ключевые термины в этих документах?"
`extract_rake_keywords`	Алгоритм RAKE — извлечение ключевых фраз	"Извлеки ключевые фразы из этой статьи"
`get_word_frequency`	Топ слов по частоте, исключая стоп-слова	"Какие слова встречаются в этом тексте чаще всего?"
`get_phrase_frequency`	Топ n-грамм фраз по частоте	"Какие фразы из двух слов встречаются чаще всего?"

Сходство текстов (5 инструментов)

Инструмент	Описание	Пример запроса
`get_jaccard_similarity`	Пересечение множеств слов, 0–1	"Насколько похожи эти два абзаца?"
`get_cosine_similarity`	Косинусное сходство (мешок слов), 0–1	"Рассчитай косинусное сходство между этими текстами"
`get_edit_distance`	Расстояние редактирования Левенштейна	"Сколько правок нужно, чтобы превратить 'kitten' в 'sitting'?"
`get_normalized_edit_distance`	Расстояние редактирования, нормализованное до 0–1	"Насколько отличаются эти две строки?"
`get_longest_common_subsequence`	Длина наибольшей общей подпоследовательности	"Какова длина LCS этих двух строк?"

Очистка текста (10 инструментов)

Инструмент	Описание	Пример запроса
`clean_remove_stopwords`	Удаление 500+ английских стоп-слов	"Удали стоп-слова из этого текста"
`clean_remove_punctuation`	Удаление всей пунктуации	"Удали пунктуацию"
`clean_remove_numbers`	Удаление числовых токенов	"Удали все числа из этого текста"
`clean_remove_urls`	Удаление URL-адресов	"Очисти от URL-адресов"
`clean_remove_emails`	Удаление адресов электронной почты	"Удали email-адреса из этого текста"
`clean_remove_html`	Удаление HTML-тегов	"Удали HTML из этого контента"
`clean_normalize_whitespace`	Сжатие и обрезка пробелов	"Нормализуй пробелы"
`clean_lowercase`	Приведение к нижнему регистру	"Преобразуй это в нижний регистр"
`porter_stem`	Стеммер Портера (чистый Python, без NLTK)	"Примени стемминг к слову 'running'"
`clean_text_pipeline`	Настраиваемая многошаговая очистка в одном вызове	"Очисти этот текст: удали HTML, URL и стоп-слова"

Детекция (8 инструментов)

Инструмент	Описание	Пример запроса
`detect_text_language`	Определение языка из 18 поддерживаемых	"На каком языке написан этот текст?"
`detect_text_encoding_type`	Определение письменности: ASCII, Latin, Cyrillic, CJK, Arabic	"Какая письменность используется в этом тексте?"
`check_is_english`	Оценка уверенности, что текст на английском, 0–1	"Этот текст на английском?"
`count_words`	Количество слов	"Сколько слов в этом тексте?"
`count_sentences`	Количество предложений	"Посчитай предложения"
`count_paragraphs`	Количество абзацов	"Сколько здесь абзацев?"
`get_avg_word_length`	Средняя длина слова в символах	"Какова средняя длина слова?"
`get_avg_sentence_length`	Средняя длина предложения в словах	"Какова средняя длина предложений?"

Суммаризация (2 инструмента)

Инструмент	Описание	Пример запроса
`get_extractive_summary`	Выбор N наиболее значимых предложений из документа	"Суммаризируй эту статью в 3 предложениях"
`get_text_statistics`	Полная статистика документа: слова, читабельность, язык, время чтения	"Дай мне статистический профиль этого текста"

Использование в качестве библиотеки

Подмодули можно импортировать напрямую — MCP-сервер не требуется:

from blackmount_nlp_mcp.sentiment import sentiment_score, sentiment_label
from blackmount_nlp_mcp.readability import reading_level
from blackmount_nlp_mcp.keywords import rake_keywords

text = "This product is absolutely amazing! The quality is excellent."

print(sentiment_score(text))
# 0.9285

print(sentiment_label(text))
# 'positive'

print(reading_level(text))
# {'grade_level': 12.39, 'label': 'college',
#  'flesch_reading_ease': 14.27, 'flesch_kincaid_grade': 12.39,
#  'gunning_fog': 19.58, 'coleman_liau': 10.94,
#  'automated_readability': 7.51, 'smog_grade': 11.21}

print(rake_keywords(text))
# [{'phrase': 'absolutely amazing', 'score': 4.0},
#  {'phrase': 'product', 'score': 1.0},
#  {'phrase': 'quality', 'score': 1.0},
#  {'phrase': 'excellent', 'score': 1.0}]

Разработка

git clone https://github.com/BlackMount-ai/blackmount-nlp-mcp
cd blackmount-nlp-mcp
pip install -e .
pytest tests/ -v

Экосистема Blackmount

blackmount-nlp-mcp создано Blackmount — инструменты для тех, кто работает с ИИ.

blackmount-mcp — память браузера, поиск по чатам ИИ и аналитика сессий в виде MCP-сервера. Используйте его вместе с blackmount-nlp-mcp для анализа сохраненных диалогов: извлекайте ключевые слова из истории чатов, оценивайте читабельность ответов ИИ, отслеживайте тренды тональности в сессиях.

app.blackmount.ai — полная платформа Blackmount. Ищите, систематизируйте и анализируйте все, что создают ваши ИИ-инструменты.

Лицензия

MIT

blackmount-nlp-mcp

blackmount-nlp-mcp

Зачем это нужно

Быстрый старт

Claude Desktop

Cursor

Любой MCP-клиент

Каталог инструментов

Токенизация (4 инструмента)

Читабельность (8 инструментов)

Анализ тональности (4 инструмента)

Извлечение ключевых слов (4 инструмента)

Сходство текстов (5 инструментов)

Очистка текста (10 инструментов)

Детекция (8 инструментов)

Суммаризация (2 инструмента)

Использование в качестве библиотеки

Разработка

Экосистема Blackmount

Лицензия

Resources

Looking for Admin?

Tools

Latest Blog Posts

MCP directory API