folder-mcp

Overview Schema Related Servers Score Discussions

model-system.tmoat.test.ts•15.1 KiB

import { describe, it, expect, beforeEach } from 'vitest'; import { MachineCapabilitiesDetector, MachineCapabilities, GPUCapabilities, CPUCapabilities, MemoryCapabilities } from '../../../src/domain/models/machine-capabilities.js'; import { ModelCompatibilityEvaluator, EvaluationCriteria, ModelCompatibilityScore } from '../../../src/domain/models/model-evaluator.js'; import { ModelSelectionService, ModelSelectionOptions, ModelRecommendation } from '../../../src/application/models/model-selection-service.js'; describe('Model System TMOAT', () => { let capabilitiesDetector: MachineCapabilitiesDetector; let compatibilityEvaluator: ModelCompatibilityEvaluator; let selectionService: ModelSelectionService; beforeEach(() => { capabilitiesDetector = new MachineCapabilitiesDetector(); compatibilityEvaluator = new ModelCompatibilityEvaluator(); selectionService = new ModelSelectionService(); }); describe('Machine Capabilities Detection', () => { it('loads curated-models.json catalog with 100+ languages', async () => { const evaluator = new ModelCompatibilityEvaluator(); const languages = evaluator.getSupportedLanguages(); expect(languages.length).toBeGreaterThan(75); // Should have 78+ languages from catalog expect(languages).toContain('en'); expect(languages).toContain('zh'); expect(languages).toContain('es'); expect(languages).toContain('ar'); expect(languages).toContain('ja'); }); it('detects machine capabilities successfully', async () => { const capabilities = await capabilitiesDetector.detectCapabilities(); expect(capabilities).toBeDefined(); expect(capabilities.gpu).toBeDefined(); expect(capabilities.cpu).toBeDefined(); expect(capabilities.memory).toBeDefined(); expect(capabilities.platform).toBeDefined(); expect(capabilities.detectedAt).toBeInstanceOf(Date); // Verify CPU detection expect(capabilities.cpu.cores).toBeGreaterThan(0); expect(capabilities.cpu.architecture).toBeDefined(); expect(Array.isArray(capabilities.cpu.features)).toBe(true); // Verify memory detection expect(capabilities.memory.totalRAMGB).toBeGreaterThan(0); expect(capabilities.memory.availableRAMGB).toBeGreaterThan(0); expect(capabilities.memory.swapGB).toBeGreaterThanOrEqual(0); console.log('✅ Detected capabilities:', { gpu: capabilities.gpu.type, vram: capabilities.gpu.vramGB, cpu: `${capabilities.cpu.cores} cores`, memory: `${capabilities.memory.totalRAMGB}GB RAM`, features: capabilities.cpu.features.slice(0, 3) }); }); it('caches capabilities for 1-hour with NodeCache', async () => { const start1 = Date.now(); const capabilities1 = await capabilitiesDetector.detectCapabilities(); const duration1 = Date.now() - start1; const start2 = Date.now(); const capabilities2 = await capabilitiesDetector.detectCapabilities(); const duration2 = Date.now() - start2; // Second call should be much faster (cached) expect(duration2).toBeLessThan(duration1 / 2); expect(capabilities1.detectedAt).toEqual(capabilities2.detectedAt); console.log('✅ Cache performance:', { firstCall: `${duration1}ms`, cachedCall: `${duration2}ms`, improvement: `${Math.round((duration1 - duration2) / duration1 * 100)}%` }); }); it('clears cache correctly for testing', async () => { const capabilities1 = await capabilitiesDetector.detectCapabilities(); capabilitiesDetector.clearCache(); // Windows needs more time for timestamp precision const delay = process.platform === 'win32' ? 100 : 10; await new Promise(resolve => setTimeout(resolve, delay)); const capabilities2 = await capabilitiesDetector.detectCapabilities(); // Should have different detection times after cache clear expect(capabilities1.detectedAt.getTime()).not.toEqual(capabilities2.detectedAt.getTime()); }, 45000); // Increase timeout: capability detection takes ~15s per call, need 2 calls = 30s+ }); describe('Model Compatibility Evaluation', () => { let mockCapabilities: MachineCapabilities; beforeEach(() => { // Mock M3 Mac capabilities for consistent testing mockCapabilities = { gpu: { type: 'apple', name: 'Apple M3 Pro', vramGB: 18, // Unified memory metalSupport: true }, cpu: { cores: 12, architecture: 'arm64', features: ['AVX2', 'FMA'] }, memory: { totalRAMGB: 18, availableRAMGB: 12, swapGB: 2 }, platform: 'darwin', detectedAt: new Date() }; }); it('scores BGE-M3 higher for CJK languages (0.62-0.86)', async () => { const criteria: EvaluationCriteria = { languages: ['zh', 'ja', 'ko'], mode: 'assisted' }; const scores = compatibilityEvaluator.evaluateModelCompatibility(mockCapabilities, criteria); const bgeM3Score = scores.find(s => s.model.id === 'gpu:bge-m3'); expect(bgeM3Score).toBeDefined(); expect(bgeM3Score!.languageScore).toBeGreaterThan(0.62); expect(bgeM3Score!.languageScore).toBeLessThan(0.86); expect(bgeM3Score!.hardwareCompatible).toBe(true); console.log('✅ BGE-M3 CJK performance:', { languages: criteria.languages, score: bgeM3Score!.languageScore, compatible: bgeM3Score!.hardwareCompatible, reasons: bgeM3Score!.reasons.slice(0, 2) }); }); it('scores MiniLM higher for European languages (0.80-0.90)', async () => { const criteria: EvaluationCriteria = { languages: ['en', 'de', 'fr', 'es'], mode: 'assisted' }; const scores = compatibilityEvaluator.evaluateModelCompatibility(mockCapabilities, criteria); const miniLMScore = scores.find(s => s.model.id === 'gpu:paraphrase-multilingual-minilm'); expect(miniLMScore).toBeDefined(); expect(miniLMScore!.languageScore).toBeGreaterThan(0.80); expect(miniLMScore!.languageScore).toBeLessThan(0.92); expect(miniLMScore!.hardwareCompatible).toBe(true); console.log('✅ MiniLM European performance:', { languages: criteria.languages, score: miniLMScore!.languageScore, compatible: miniLMScore!.hardwareCompatible }); }); it('recommends GPU models only with 4GB+ VRAM', async () => { // Test with insufficient VRAM const lowVRAMCapabilities: MachineCapabilities = { ...mockCapabilities, gpu: { type: 'nvidia', name: 'GTX 1050', vramGB: 2 // Only 2GB } }; const criteria: EvaluationCriteria = { languages: ['en'], mode: 'assisted' }; const scores = compatibilityEvaluator.evaluateModelCompatibility(lowVRAMCapabilities, criteria); const gpuModels = scores.filter(s => s.model.id.startsWith('gpu:')); // Check all models for appropriate behavior with insufficient VRAM const allScores = compatibilityEvaluator.evaluateModelCompatibility(lowVRAMCapabilities, criteria); let hasInsufficientVramError = false; let hasCpuFallback = false; for (const score of allScores) { if (!score.hardwareCompatible) { if (score.reasons.some(r => r.includes('Insufficient VRAM'))) { hasInsufficientVramError = true; } } else { if (score.reasons.some(r => r.includes('CPU fallback')) || score.model.id.includes('lite')) { hasCpuFallback = true; } } } // Expect at least one model to show insufficient VRAM or use CPU fallback expect(hasInsufficientVramError || hasCpuFallback).toBe(true); console.log('✅ Low VRAM filtering:', { vram: lowVRAMCapabilities.gpu.vramGB, compatibleModels: scores.filter(s => s.hardwareCompatible).length, incompatibleReasons: scores.filter(s => !s.hardwareCompatible).slice(0, 2).map(s => s.reasons[0]) }); }); it('filters ALL Ollama models from Assisted mode', async () => { const assistedCriteria: EvaluationCriteria = { languages: ['en'], mode: 'assisted' }; const assistedScores = compatibilityEvaluator.evaluateModelCompatibility(mockCapabilities, assistedCriteria); const ollamaModels = assistedScores.filter(s => s.model.id.startsWith('ollama:')); expect(ollamaModels.length).toBe(0); console.log('✅ Assisted mode filtering:', { mode: 'assisted', totalModels: assistedScores.length, ollamaModels: ollamaModels.length, modelTypes: assistedScores.map(s => s.model.id.split(':')[0]!).reduce((acc, type) => { acc[type] = (acc[type] || 0) + 1; return acc; }, {} as Record<string, number>) }); }); it('excludes Ollama models from curated evaluation (architectural separation)', async () => { // After architectural fix: Ollama models are NOT in curated catalog const manualCriteria: EvaluationCriteria = { languages: ['en'], mode: 'manual' }; const manualScores = compatibilityEvaluator.evaluateModelCompatibility(mockCapabilities, manualCriteria); const ollamaModels = manualScores.filter(s => s.model.id.startsWith('ollama:')); // Ollama models should NOT be in curated evaluation anymore expect(ollamaModels.length).toBe(0); // Instead, we should only have GPU and CPU models const gpuModels = manualScores.filter(s => s.model.id.startsWith('gpu:') && !s.model.id.includes('lite')); const cpuModels = manualScores.filter(s => s.model.id.startsWith('cpu:')); expect(gpuModels.length).toBeGreaterThan(0); expect(cpuModels.length).toBeGreaterThan(0); console.log('✅ Manual mode inclusion:', { mode: 'manual', totalModels: manualScores.length, ollamaModels: ollamaModels.length, ollamaTypes: ollamaModels.map(s => s.model.displayName) }); }); }); describe('Model Selection Service Integration', () => { it('provides assisted mode recommendations correctly', async () => { const recommendation = await selectionService.getAssistedModeRecommendation(['en', 'zh']); expect(recommendation.primaryChoice).toBeDefined(); expect(recommendation.alternatives.length).toBeLessThanOrEqual(2); expect(recommendation.machineCapabilities).toBeDefined(); expect(recommendation.evaluationCriteria.mode).toBe('assisted'); // Should not include Ollama models const allRecommended = [recommendation.primaryChoice, ...recommendation.alternatives]; const hasOllamaModels = allRecommended.some(score => score.model.id.startsWith('ollama:')); expect(hasOllamaModels).toBe(false); console.log('✅ Assisted recommendation:', { primary: recommendation.primaryChoice.model.displayName, score: recommendation.primaryChoice.score, alternatives: recommendation.alternatives.map(alt => alt.model.displayName), languages: recommendation.evaluationCriteria.languages }); }); it('provides manual mode options with Ollama models', async () => { const recommendation = await selectionService.getManualModeOptions(['en']); expect(recommendation.primaryChoice).toBeDefined(); expect(recommendation.alternatives.length).toBeLessThanOrEqual(5); expect(recommendation.evaluationCriteria.mode).toBe('manual'); // After architectural fix: Only curated models (GPU/CPU) in selection service const allOptions = [recommendation.primaryChoice, ...recommendation.alternatives]; const hasOllamaModels = allOptions.some(score => score.model.id.startsWith('ollama:')); expect(hasOllamaModels).toBe(false); // Ollama excluded from curated selection // Should have GPU and CPU models instead const hasGpuModels = allOptions.some(score => score.model.id.startsWith('gpu:') && !score.model.id.includes('lite')); const hasCpuModels = allOptions.some(score => score.model.id.startsWith('cpu:')); expect(hasGpuModels || hasCpuModels).toBe(true); console.log('✅ Manual mode options (curated only):', { primary: recommendation.primaryChoice.model.displayName, totalOptions: allOptions.length, gpuCount: allOptions.filter(opt => opt.model.id.startsWith('gpu:') && !opt.model.id.includes('lite')).length, cpuCount: allOptions.filter(opt => opt.model.id.startsWith('cpu:')).length }); }); it('validates model selection against current hardware', async () => { // Test with a model that should work const bgeValidation = await selectionService.validateModelSelection('gpu:bge-m3'); expect(bgeValidation.valid).toBe(true); expect(bgeValidation.issues.length).toBe(0); // Test with a non-existent model const invalidValidation = await selectionService.validateModelSelection('non-existent-model'); expect(invalidValidation.valid).toBe(false); expect(invalidValidation.issues.length).toBeGreaterThan(0); console.log('✅ Model validation:', { validModel: bgeValidation.valid, invalidModel: invalidValidation.valid, invalidIssues: invalidValidation.issues[0] }); }); it('provides performance information for models', () => { const bgeInfo = selectionService.getModelPerformanceInfo('gpu:bge-m3'); expect(bgeInfo.model).toBeDefined(); expect(bgeInfo.expectedSpeed).toBeDefined(); expect(bgeInfo.memoryUsage).toBeDefined(); expect(bgeInfo.accuracyRating).toBeDefined(); expect(bgeInfo.languageSupport).toBeDefined(); console.log('✅ Performance info:', { model: bgeInfo.model?.displayName, speed: bgeInfo.expectedSpeed, memory: bgeInfo.memoryUsage, accuracy: bgeInfo.accuracyRating, languages: bgeInfo.languageSupport }); }); }); describe('Language Support Verification', () => { it('supports documented language performance scores', () => { const bgeModel = compatibilityEvaluator.getModelById('gpu:bge-m3'); expect(bgeModel).toBeDefined(); if (!bgeModel) { throw new Error('BGE model not found'); } // Verify key languages from catalog expect(bgeModel.languagePerformance.en).toBeDefined(); expect(bgeModel.languagePerformance.zh).toBeDefined(); expect(bgeModel.languagePerformance.ar).toBeDefined(); expect(bgeModel.languagePerformance.ja).toBeDefined(); // Verify Arabic performance as documented (0.78) expect(bgeModel.languagePerformance.ar).toBeCloseTo(0.78, 2); // Verify Chinese performance as documented (0.62) expect(bgeModel.languagePerformance.zh).toBeCloseTo(0.62, 2); console.log('✅ Language performance verification:', { model: bgeModel.displayName, arabic: bgeModel.languagePerformance.ar, chinese: bgeModel.languagePerformance.zh, totalLanguages: Object.keys(bgeModel.languagePerformance).length }); }); }); });

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/okets/folder-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

model-system.tmoat.test.ts•15.1 KiB