Skip to main content
Glama

KFabric

KFabric est une plateforme Python-first de fabrication de corpus documentaires. Le projet vise un problème très concret : aider à construire un corpus traçable, pondéré et réutilisable à partir de sources hétérogènes, avant même de brancher un assistant RAG conversationnel.

Au lieu de passer directement du web au chat, KFabric se concentre d'abord sur la qualité du matériau documentaire :

  • découverte de documents candidats

  • collecte et normalisation

  • scoring et décision documentaire

  • récupération de fragments utiles dans des documents rejetés

  • consolidation et synthèse

  • préparation d'artefacts indexables pour des usages RAG futurs

Pourquoi KFabric

Dans beaucoup de pipelines RAG, la vraie faiblesse n'est pas le modèle mais le corpus. KFabric part de l'idée inverse :

  • un bon corpus vaut mieux qu'une mauvaise conversation bien emballée

  • les documents faibles contiennent parfois des signaux utiles à sauver

  • la traçabilité et la prudence documentaire doivent exister dès le MVP

  • un serveur MCP et une API REST doivent exposer exactement le même coeur métier

Ce que fait le MVP

Le MVP actuel couvre déjà un flux bout en bout :

  1. créer une requête documentaire

  2. découvrir des documents candidats

  3. collecter et parser un document

  4. attribuer un score global et des sous-scores

  5. accepter, rejeter, ou rejeter avec récupération partielle

  6. consolider les fragments sauvés

  7. générer une synthèse documentaire prudente

  8. construire un corpus final

  9. préparer un artefact d'indexation

Points forts

  • API REST FastAPI pour piloter le pipeline corpus

  • serveur MCP natif en Python

  • workers Celery pour les traitements longs

  • UI légère en Jinja2, HTMX et Alpine.js

  • modèles SQLAlchemy 2 et migration Alembic initiale

  • mode sécurisé activé par défaut

  • approche corpus-first avant chat RAG complet

Architecture

Le projet est structuré comme un monolithe modulaire Python :

Stack technique

  • Python 3.12

  • FastAPI

  • Pydantic v2

  • SQLAlchemy 2 + Alembic

  • Celery + Redis + RabbitMQ

  • PostgreSQL prêt pour la production

  • MCP Python SDK

  • Jinja2 + HTMX + Alpine.js

Démarrage rapide

Installation minimale :

python3.12 -m venv .venv
source .venv/bin/activate
pip install setuptools wheel
pip install -e ".[dev]" --no-build-isolation
cp .env.example .env
uvicorn kfabric.api.app:app --reload

Si tu veux aussi les dépendances plus lourdes liées aux connecteurs et à la préparation RAG étendue :

pip install -e ".[dev,extended]" --no-build-isolation

L'application démarre ensuite sur :

  • UI : http://127.0.0.1:8000/

  • API : http://127.0.0.1:8000/docs

Vérification locale

Les tests principaux peuvent être lancés avec :

pytest

Le MVP a été vérifié localement avec :

  • compilation Python

  • tests API

  • tests REST/MCP

  • tests de scoring et de récupération de fragments

API et MCP

KFabric expose deux surfaces complémentaires :

  • une API REST métier pour piloter tout le pipeline

  • une API REST concordante MCP

  • un serveur MCP natif en Python pour les tools, resources et prompts

Exemples de capacités exposées :

  • discover_documents

  • list_candidates

  • analyze_document

  • accept_document

  • reject_document

  • generate_fragment_synthesis

  • get_corpus_status

Statut du projet

KFabric est aujourd'hui un MVP technique fonctionnel.

Ce qui existe :

  • coeur métier corpus-first

  • contrat REST principal

  • socle MCP

  • UI workflow

  • migration initiale

  • tests de base

Ce qui viendra ensuite :

  • vrais connecteurs documentaires

  • meilleure collecte multi-format

  • embeddings réels et intégration vectorielle étendue

  • scoring plus fin par domaine

  • multi-tenant

  • interface de production plus avancée

Développement avec assistance IA

Ce projet a été conçu et développé avec assistance IA, puis structuré, contrôlé, vérifié et arbitré manuellement.

L'IA a servi d'accélérateur pour :

  • le prototypage

  • l'implémentation initiale

  • la documentation

  • certaines itérations techniques

Les choix d'architecture, la validation du flux MVP et la cohérence produit ont été assumés et consolidés manuellement.

Licence

Licence non encore définie.

Install Server
A
security – no known vulnerabilities
F
license - not found
A
quality - confirmed to work

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/fbailleux2/kfabric'

If you have feedback or need assistance with the MCP directory API, please join our Discord server