Local DeepWiki MCP Server

Overview Schema Related Servers Score Discussions

wiki.py•39.5 KiB

"""Wiki documentation generator using LLM providers.""" from __future__ import annotations import hashlib import json import time from collections.abc import Awaitable, Callable from pathlib import Path from typing import TYPE_CHECKING if TYPE_CHECKING: from local_deepwiki.plugins.base import WikiGeneratorPlugin from local_deepwiki.config import Config, get_config from local_deepwiki.core.vectorstore import VectorStore from local_deepwiki.events import EventType, get_event_emitter from local_deepwiki.generators.coverage import generate_coverage_page from local_deepwiki.generators.crosslinks import EntityRegistry, add_cross_links from local_deepwiki.generators.dependency_graph import ( DependencyGraphGenerator, generate_dependency_graph_page, ) from local_deepwiki.generators.stale_detection import generate_stale_report_page from local_deepwiki.generators.glossary import generate_glossary_page from local_deepwiki.generators.inheritance import generate_inheritance_page from local_deepwiki.generators.manifest import ProjectManifest, get_cached_manifest from local_deepwiki.generators.progress_tracker import GenerationProgress from local_deepwiki.generators.search import write_full_search_index from local_deepwiki.generators.see_also import ( RelationshipAnalyzer, add_see_also_sections, ) from local_deepwiki.generators.source_refs import add_source_refs_sections from local_deepwiki.generators.toc import generate_toc, write_toc from local_deepwiki.generators.wiki_codemaps import generate_codemap_pages from local_deepwiki.generators.wiki_files import generate_file_docs from local_deepwiki.generators.wiki_modules import generate_module_docs from local_deepwiki.generators.wiki_pages import ( generate_architecture_page, generate_changelog_page, generate_dependencies_page, generate_overview_page, ) from local_deepwiki.generators.wiki_status import WikiStatusManager from local_deepwiki.logging import get_logger from local_deepwiki.prompts import PromptManager from local_deepwiki.models import ( IndexStatus, ProgressCallback, WikiGenerationStatus, WikiPage, WikiStructure, ) from local_deepwiki.plugins.registry import get_plugin_registry from local_deepwiki.providers.llm import get_cached_llm_provider logger = get_logger(__name__) class _GenerationContext: """Internal context for tracking wiki generation state. This class encapsulates mutable state during generation to avoid passing many parameters between helper methods. """ __slots__ = ( "pages", "pages_generated", "pages_skipped", "all_source_files", "full_rebuild", ) def __init__( self, pages: list["WikiPage"], pages_generated: int, pages_skipped: int, all_source_files: list[str], full_rebuild: bool, ): self.pages = pages self.pages_generated = pages_generated self.pages_skipped = pages_skipped self.all_source_files = all_source_files self.full_rebuild = full_rebuild class WikiGenerator: """Generate wiki documentation from indexed code.""" def __init__( self, wiki_path: Path, vector_store: VectorStore, config: Config | None = None, llm_provider_name: str | None = None, ): """Initialize the wiki generator. Args: wiki_path: Path to wiki output directory. vector_store: Vector store with indexed code. config: Optional configuration. llm_provider_name: Override LLM provider ("ollama", "anthropic", "openai"). """ self.wiki_path = wiki_path self.vector_store = vector_store base_config = config or get_config() # Create a copy with overridden LLM provider if specified if llm_provider_name: self.config = base_config.with_llm_provider(llm_provider_name) # type: ignore else: # Store a defensive copy to prevent external mutation self.config = base_config.model_copy(deep=True) # Use cached LLM provider for better performance on repeated generations cache_path = wiki_path / "llm_cache.lance" self.llm = get_cached_llm_provider( cache_path=cache_path, embedding_provider=vector_store.embedding_provider, cache_config=self.config.llm_cache, llm_config=self.config.llm, ) # Initialize prompt manager for custom prompt support custom_prompts_dir = None if self.config.prompts.custom_dir: custom_prompts_dir = Path(self.config.prompts.custom_dir) self._prompt_manager = PromptManager( custom_dir=custom_prompts_dir, repo_path=None, # Will be set during generation ) # Get provider-specific system prompt (may be overridden by custom prompts) self._system_prompt = self._prompt_manager.get_wiki_system_prompt( provider=self.config.llm.provider, ) # Entity registry for cross-linking self.entity_registry = EntityRegistry() # Relationship analyzer for See Also sections self.relationship_analyzer = RelationshipAnalyzer() # Status manager for incremental updates self.status_manager = WikiStatusManager(wiki_path) # Cached project manifest (parsed from package files) self._manifest: ProjectManifest | None = None # Repository path (set during generation) self._repo_path: Path | None = None def _get_main_definition_lines(self) -> dict[str, tuple[int, int]]: """Get line range of main definition (first class or function) per file. Delegates to VectorStore's public method for proper encapsulation. Returns: Dict mapping file_path to (start_line, end_line) tuple. """ return self.vector_store.get_main_definition_lines() async def generate( self, index_status: IndexStatus, progress_callback: ProgressCallback | None = None, full_rebuild: bool = False, ) -> WikiStructure: """Generate wiki documentation for the indexed repository. Args: index_status: The index status with file information. progress_callback: Optional progress callback. full_rebuild: If True, regenerate all pages. Otherwise, only regenerate changed pages. Returns: WikiStructure with generated pages. """ logger.info(f"Starting wiki generation for {index_status.repo_path}") logger.debug( f"Full rebuild: {full_rebuild}, Total files: {index_status.total_files}" ) # Emit WIKI_START event emitter = get_event_emitter() await emitter.emit( EventType.WIKI_START, { "repo_path": index_status.repo_path, "full_rebuild": full_rebuild, "total_files": index_status.total_files, }, ) # Initialize generation context ctx = await self._init_generation_context(index_status, full_rebuild) # Phase 1: Generate summary pages (overview, architecture) await self._generate_summary_pages(ctx, index_status, progress_callback) # Phase 2: Analyze imports for relationship tracking await self._analyze_imports_for_relationships() # Phase 3: Generate module documentation await self._generate_module_pages(ctx, index_status, progress_callback) # Phase 4: Generate file documentation await self._generate_file_pages(ctx, index_status, progress_callback) # Phase 5: Generate dependencies page await self._generate_dependencies_page(ctx, index_status, progress_callback) # Phase 6: Generate changelog await self._generate_changelog_page(ctx, progress_callback) # Phase 7: Generate auxiliary pages (inheritance, glossary, coverage) await self._generate_auxiliary_pages(ctx, index_status, progress_callback) # Phase 7b: Run wiki generator plugins await self._run_plugin_generators(ctx, index_status, progress_callback) # Phase 7c: Generate codemap pages await self._generate_codemap_pages(ctx, index_status, progress_callback) # Phase 8: Apply cross-links and see-also sections ctx.pages = await self._apply_cross_linking(ctx.pages, progress_callback) # Phase 9: Generate search index and TOC await self._generate_search_and_toc(ctx.pages, index_status, progress_callback) # Phase 10: Generate freshness report and finalize wiki_status = self._build_wiki_status(ctx, index_status) await self._generate_freshness_and_finalize(ctx, wiki_status, progress_callback) logger.info( f"Wiki generation complete: {ctx.pages_generated} pages generated, " f"{ctx.pages_skipped} pages unchanged, {len(ctx.pages)} total pages" ) # Log LLM cache statistics if available if hasattr(self.llm, "stats"): try: cache_stats = self.llm.stats hits = int(cache_stats.get("hits", 0)) misses = int(cache_stats.get("misses", 0)) skipped = int(cache_stats.get("skipped", 0)) total = hits + misses hit_rate = (hits / total * 100) if total > 0 else 0.0 logger.info( f"LLM cache stats: {hits} hits, {misses} misses, {skipped} skipped " f"({hit_rate:.1f}% hit rate)" ) except (TypeError, ValueError, AttributeError): # Skip logging if stats are not properly available (e.g., mock objects) pass # Finalize progress tracker and print summary summary = self._progress.finalize(success=True) print(summary) # Emit WIKI_COMPLETE event await emitter.emit( EventType.WIKI_COMPLETE, { "repo_path": index_status.repo_path, "total_pages": len(ctx.pages), "pages_generated": ctx.pages_generated, "pages_skipped": ctx.pages_skipped, }, ) return WikiStructure(root=str(self.wiki_path), pages=ctx.pages) async def _init_generation_context( self, index_status: IndexStatus, full_rebuild: bool ) -> _GenerationContext: """Initialize the generation context with tracking state. Args: index_status: The index status with file information. full_rebuild: Whether to do a full rebuild. Returns: Initialized generation context. """ # Initialize live progress tracker self._progress = GenerationProgress(wiki_path=self.wiki_path) self._progress.start_phase("initializing", total=0) # Store repo path and parse manifest for grounded generation (with caching) self._repo_path = Path(index_status.repo_path) self._manifest = get_cached_manifest(self._repo_path, cache_dir=self.wiki_path) # Update prompt manager with repo path for per-project prompts self._prompt_manager.loader.repo_path = self._repo_path self._prompt_manager.loader.clear_cache() # Clear cache to pick up repo prompts # Reload system prompt in case repo has custom prompts self._system_prompt = self._prompt_manager.get_wiki_system_prompt( provider=self.config.llm.provider, ) # Build file hash map for incremental generation self.status_manager.file_hashes = {f.path: f.hash for f in index_status.files} all_source_files = list(self.status_manager.file_hashes.keys()) # Load previous wiki status for incremental updates if not full_rebuild: await self.status_manager.load_status() # Log regeneration summary for incremental updates summary = self.status_manager.get_regeneration_summary() if summary["is_full_rebuild"]: logger.info("No previous wiki status found, performing full generation") else: logger.info( f"Incremental update: {summary['changed_file_count']} files changed, " f"{summary['affected_page_count']} pages to regenerate, " f"{summary['unchanged_page_count']} pages unchanged" ) if summary["changed_file_count"] <= 5: for f in summary["changed_files"]: logger.debug(f" Changed: {f}") # Pre-compute line info for source files (for source refs with line numbers) self.status_manager.file_line_info = self._get_main_definition_lines() return _GenerationContext( pages=[], pages_generated=0, pages_skipped=0, all_source_files=all_source_files, full_rebuild=full_rebuild, ) async def _generate_summary_pages( self, ctx: _GenerationContext, index_status: IndexStatus, progress_callback: ProgressCallback | None, ) -> None: """Generate overview and architecture pages. Args: ctx: Generation context for tracking state. index_status: The index status. progress_callback: Optional progress callback. """ total_steps = 14 # Generate overview page if progress_callback: progress_callback("Generating overview", 0, total_steps) overview_page, generated = await self._generate_or_load_page( ctx=ctx, page_path="index.md", generator=lambda: self._generate_overview(index_status), source_files=ctx.all_source_files, ) ctx.pages.append(overview_page) if generated: ctx.pages_generated += 1 else: ctx.pages_skipped += 1 # Generate architecture page if progress_callback: progress_callback("Generating architecture docs", 1, total_steps) architecture_page, generated = await self._generate_or_load_page( ctx=ctx, page_path="architecture.md", generator=lambda: self._generate_architecture(index_status), source_files=ctx.all_source_files, ) ctx.pages.append(architecture_page) if generated: ctx.pages_generated += 1 else: ctx.pages_skipped += 1 async def _generate_or_load_page( self, ctx: _GenerationContext, page_path: str, generator: "Callable[[], Awaitable[WikiPage]]", source_files: list[str], ) -> tuple[WikiPage, bool]: """Generate a page or load from cache if unchanged. Args: ctx: Generation context. page_path: Path for the wiki page. generator: Async function to generate the page. source_files: Source files this page depends on. Returns: Tuple of (page, was_generated). """ if ctx.full_rebuild or self.status_manager.needs_regeneration( page_path, source_files ): page = await generator() was_generated = True else: existing_page = await self.status_manager.load_existing_page(page_path) if existing_page is None: page = await generator() was_generated = True else: page = existing_page was_generated = False self.status_manager.record_page_status(page, source_files) await self._write_page(page) # Emit WIKI_PAGE_COMPLETE event emitter = get_event_emitter() await emitter.emit( EventType.WIKI_PAGE_COMPLETE, { "page_path": page.path, "page_title": page.title, "was_generated": was_generated, }, ) return page, was_generated async def _analyze_imports_for_relationships(self) -> None: """Collect import chunks for relationship analysis (See Also sections).""" import_results = await self.vector_store.search( "import require include", limit=self.config.wiki.import_search_limit, ) import_chunks = [ r.chunk for r in import_results if r.chunk.chunk_type.value == "import" ] self.relationship_analyzer.analyze_chunks(import_chunks) async def _generate_module_pages( self, ctx: _GenerationContext, index_status: IndexStatus, progress_callback: ProgressCallback | None, ) -> None: """Generate module documentation pages. Args: ctx: Generation context. index_status: Index status. progress_callback: Optional progress callback. """ if progress_callback: progress_callback("Generating module documentation", 2, 14) self._progress.start_phase("modules", total=0) module_pages, gen_count, skip_count = await generate_module_docs( index_status=index_status, vector_store=self.vector_store, llm=self.llm, system_prompt=self._system_prompt, status_manager=self.status_manager, full_rebuild=ctx.full_rebuild, ) ctx.pages_generated += gen_count ctx.pages_skipped += skip_count # Update module stats and write pages self._progress._phase_stats["modules"].items_completed = len(module_pages) self._progress.complete_phase() for page in module_pages: ctx.pages.append(page) await self._write_page(page) async def _generate_file_pages( self, ctx: _GenerationContext, index_status: IndexStatus, progress_callback: ProgressCallback | None, ) -> None: """Generate file-level documentation pages. Args: ctx: Generation context. index_status: Index status. progress_callback: Optional progress callback. """ if progress_callback: progress_callback("Generating file documentation", 3, 14) file_pages, gen_count, skip_count = await generate_file_docs( index_status=index_status, vector_store=self.vector_store, llm=self.llm, system_prompt=self._system_prompt, status_manager=self.status_manager, entity_registry=self.entity_registry, config=self.config, progress_callback=progress_callback, full_rebuild=ctx.full_rebuild, write_callback=self._write_page, generation_progress=self._progress, ) ctx.pages_generated += gen_count ctx.pages_skipped += skip_count ctx.pages.extend(file_pages) async def _generate_dependencies_page( self, ctx: _GenerationContext, index_status: IndexStatus, progress_callback: ProgressCallback | None, ) -> None: """Generate the dependencies documentation page. Args: ctx: Generation context. index_status: Index status. progress_callback: Optional progress callback. """ if progress_callback: progress_callback("Generating dependencies", 4, 14) deps_path = "dependencies.md" if ctx.full_rebuild or self.status_manager.needs_regeneration( deps_path, ctx.all_source_files ): deps_page, deps_source_files = await self._generate_dependencies( index_status ) ctx.pages_generated += 1 else: existing_deps_page = await self.status_manager.load_existing_page(deps_path) if existing_deps_page is None: deps_page, deps_source_files = await self._generate_dependencies( index_status ) ctx.pages_generated += 1 else: deps_page = existing_deps_page # Use source files from previous status if available prev_status = self.status_manager.page_statuses.get(deps_path) or ( self.status_manager.previous_status.pages.get(deps_path) if self.status_manager.previous_status else None ) deps_source_files = ( prev_status.source_files if prev_status else ctx.all_source_files ) ctx.pages_skipped += 1 ctx.pages.append(deps_page) self.status_manager.record_page_status(deps_page, deps_source_files) await self._write_page(deps_page) async def _generate_changelog_page( self, ctx: _GenerationContext, progress_callback: ProgressCallback | None, ) -> None: """Generate changelog page from git history. Args: ctx: Generation context. progress_callback: Optional progress callback. """ if progress_callback: progress_callback("Generating changelog", 5, 14) changelog_page = await self._generate_changelog() if changelog_page: ctx.pages.append(changelog_page) self.status_manager.record_page_status(changelog_page, ctx.all_source_files) await self._write_page(changelog_page) ctx.pages_generated += 1 async def _generate_auxiliary_pages( self, ctx: _GenerationContext, index_status: IndexStatus, progress_callback: ProgressCallback | None, ) -> None: """Generate auxiliary pages: inheritance, glossary, and coverage. Args: ctx: Generation context. index_status: Index status. progress_callback: Optional progress callback. """ # Inheritance page if progress_callback: progress_callback("Generating inheritance tree", 6, 14) inheritance_content = await generate_inheritance_page( index_status, self.vector_store ) if inheritance_content: inheritance_page = WikiPage( path="inheritance.md", title="Class Inheritance", content=inheritance_content, generated_at=time.time(), ) ctx.pages.append(inheritance_page) self.status_manager.record_page_status( inheritance_page, ctx.all_source_files ) await self._write_page(inheritance_page) ctx.pages_generated += 1 # Glossary page if progress_callback: progress_callback("Generating glossary", 7, 14) glossary_content = await generate_glossary_page(index_status, self.vector_store) if glossary_content: glossary_page = WikiPage( path="glossary.md", title="Glossary", content=glossary_content, generated_at=time.time(), ) ctx.pages.append(glossary_page) self.status_manager.record_page_status(glossary_page, ctx.all_source_files) await self._write_page(glossary_page) ctx.pages_generated += 1 # Coverage report page if progress_callback: progress_callback("Generating coverage report", 8, 14) coverage_content = await generate_coverage_page(index_status, self.vector_store) if coverage_content: coverage_page = WikiPage( path="coverage.md", title="Documentation Coverage", content=coverage_content, generated_at=time.time(), ) ctx.pages.append(coverage_page) self.status_manager.record_page_status(coverage_page, ctx.all_source_files) await self._write_page(coverage_page) ctx.pages_generated += 1 # Dependency graph page if progress_callback: progress_callback("Generating dependency graph", 9, 14) try: dependency_content = await generate_dependency_graph_page( index_status=index_status, vector_store=self.vector_store, show_external=True, max_external=10, wiki_base_path="files/", ) if dependency_content: dependency_page = WikiPage( path="dependency-graph.md", title="Dependency Graph", content=dependency_content, generated_at=time.time(), ) ctx.pages.append(dependency_page) self.status_manager.record_page_status( dependency_page, ctx.all_source_files ) await self._write_page(dependency_page) ctx.pages_generated += 1 except Exception as e: logger.warning(f"Failed to generate dependency graph: {e}") def _sort_generators_by_dependencies( self, generators: list["WikiGeneratorPlugin"], ) -> list["WikiGeneratorPlugin"]: """Sort generators respecting run_after dependencies with validation. Uses topological sort to ensure generators run after their dependencies. Validates that all dependencies exist and warns about missing ones. Args: generators: List of generator plugins to sort. Returns: Sorted list of generators respecting dependencies. """ if not generators: return generators # Build name -> generator mapping by_name: dict[str, "WikiGeneratorPlugin"] = { g.generator_name: g for g in generators } available_names = set(by_name.keys()) # Validate dependencies exist and warn about missing ones for generator in generators: missing_deps = set(generator.run_after) - available_names if missing_deps: logger.warning( f"Wiki generator '{generator.generator_name}' has missing dependencies: " f"{missing_deps}. These generators are not registered and will be skipped." ) # Build dependency graph for topological sort # in_degree[name] = number of dependencies that must run first in_degree: dict[str, int] = {g.generator_name: 0 for g in generators} # dependents[name] = list of generators that depend on this one dependents: dict[str, list[str]] = {g.generator_name: [] for g in generators} for generator in generators: for dep in generator.run_after: if dep in available_names: in_degree[generator.generator_name] += 1 dependents[dep].append(generator.generator_name) # Kahn's algorithm for topological sort # Start with generators that have no dependencies # Sort by priority (higher first) within each level ready = [g for g in generators if in_degree[g.generator_name] == 0] ready.sort(key=lambda g: g.priority, reverse=True) sorted_generators: list["WikiGeneratorPlugin"] = [] while ready: # Take the highest priority generator from ready list current = ready.pop(0) sorted_generators.append(current) # Update dependents for dep_name in dependents[current.generator_name]: in_degree[dep_name] -= 1 if in_degree[dep_name] == 0: # Insert in priority order dep_gen = by_name[dep_name] insert_idx = 0 for i, g in enumerate(ready): if dep_gen.priority > g.priority: insert_idx = i break insert_idx = i + 1 ready.insert(insert_idx, dep_gen) # Check for cycles (some generators still have unresolved dependencies) if len(sorted_generators) != len(generators): unresolved = [ g.generator_name for g in generators if g not in sorted_generators ] logger.error( f"Circular dependency detected in wiki generators: {unresolved}. " f"These generators will not run." ) return sorted_generators async def _run_plugin_generators( self, ctx: _GenerationContext, index_status: IndexStatus, progress_callback: ProgressCallback | None, ) -> None: """Run registered wiki generator plugins. Args: ctx: Generation context. index_status: Index status. progress_callback: Optional progress callback. """ registry = get_plugin_registry() generators: list["WikiGeneratorPlugin"] = list( registry.wiki_generators.values() ) if not generators: return # Validate and sort generators respecting run_after dependencies generators = self._sort_generators_by_dependencies(generators) logger.info(f"Running {len(generators)} wiki generator plugin(s)") # Build context dict for plugins plugin_context = { "vector_store": self.vector_store, "llm": self.llm, "config": self.config, "existing_pages": list(ctx.pages), } for generator in generators: try: logger.debug( f"Running wiki generator plugin: {generator.generator_name}" ) result = await generator.generate( index_status=index_status, wiki_path=self.wiki_path, context=plugin_context, ) # Add generated pages for page in result.pages: ctx.pages.append(page) self.status_manager.record_page_status(page, ctx.all_source_files) await self._write_page(page) ctx.pages_generated += 1 # Update existing_pages in context for subsequent plugins plugin_context["existing_pages"] = list(ctx.pages) logger.debug( f"Plugin '{generator.generator_name}' generated {len(result.pages)} page(s)" ) except Exception as e: logger.warning( f"Wiki generator plugin '{generator.generator_name}' failed: {e}" ) async def _generate_codemap_pages( self, ctx: _GenerationContext, index_status: IndexStatus, progress_callback: ProgressCallback | None, ) -> None: """Generate codemap pages for auto-discovered entry points. Args: ctx: Generation context. index_status: Index status. progress_callback: Optional progress callback. """ codemap_enabled = getattr(self.config.wiki, "codemap_enabled", None) if not isinstance(codemap_enabled, bool) or not codemap_enabled: return if progress_callback: progress_callback("Generating codemaps", 10, 14) assert self._repo_path is not None, ( "Repository path must be set before generating codemaps" ) self._progress.start_phase("codemaps", total=0) codemap_pages, gen_count, skip_count = await generate_codemap_pages( vector_store=self.vector_store, llm=self.llm, repo_path=self._repo_path, wiki_path=self.wiki_path, status_manager=self.status_manager, config=self.config.wiki, full_rebuild=ctx.full_rebuild, ) ctx.pages_generated += gen_count ctx.pages_skipped += skip_count self._progress._phase_stats["codemaps"].items_completed = len(codemap_pages) self._progress.complete_phase() for page in codemap_pages: ctx.pages.append(page) await self._write_page(page) async def _apply_cross_linking( self, pages: list[WikiPage], progress_callback: ProgressCallback | None, ) -> list[WikiPage]: """Apply cross-links, source refs, and see-also sections to pages. Args: pages: List of wiki pages to process. progress_callback: Optional progress callback. Returns: Updated list of pages with cross-linking applied. """ if progress_callback: progress_callback("Adding cross-links", 10, 14) pages = add_cross_links(pages, self.entity_registry) # Add Relevant Source Files sections with local wiki links pages = add_source_refs_sections( pages, self.status_manager.page_statuses, self.wiki_path ) if progress_callback: progress_callback("Adding See Also sections", 11, 14) pages = add_see_also_sections(pages, self.relationship_analyzer) # Re-write pages with cross-links and See Also sections for page in pages: await self._write_page(page) return pages async def _generate_search_and_toc( self, pages: list[WikiPage], index_status: IndexStatus, progress_callback: ProgressCallback | None, ) -> None: """Generate search index and table of contents. Args: pages: List of wiki pages. index_status: Index status. progress_callback: Optional progress callback. """ if progress_callback: progress_callback("Generating search index", 12, 14) await write_full_search_index( self.wiki_path, pages, index_status, self.vector_store ) # Generate table of contents with hierarchical numbering page_list = [{"path": p.path, "title": p.title} for p in pages] toc = generate_toc(page_list) write_toc(toc, self.wiki_path) def _build_wiki_status( self, ctx: _GenerationContext, index_status: IndexStatus, ) -> WikiGenerationStatus: """Build the wiki generation status object. Args: ctx: Generation context. index_status: Index status. Returns: WikiGenerationStatus object. """ return WikiGenerationStatus( repo_path=index_status.repo_path, generated_at=time.time(), total_pages=len(ctx.pages), index_status_hash=hashlib.sha256( json.dumps(index_status.model_dump(), sort_keys=True).encode() ).hexdigest()[:16], pages=self.status_manager.page_statuses, ) async def _generate_freshness_and_finalize( self, ctx: _GenerationContext, wiki_status: WikiGenerationStatus, progress_callback: ProgressCallback | None, ) -> None: """Generate freshness report and finalize wiki status. Args: ctx: Generation context. wiki_status: Wiki generation status to update. progress_callback: Optional progress callback. """ total_steps = 14 assert self._repo_path is not None, ( "Repository path must be set before generating wiki" ) freshness_page = generate_stale_report_page( repo_path=self._repo_path, wiki_status=wiki_status, stale_threshold_days=0, ) ctx.pages.append(freshness_page) self.status_manager.record_page_status(freshness_page, ctx.all_source_files) await self._write_page(freshness_page) ctx.pages_generated += 1 # Update wiki status with freshness page wiki_status.pages[freshness_page.path] = self.status_manager.page_statuses[ freshness_page.path ] wiki_status.total_pages = len(ctx.pages) await self.status_manager.save_status(wiki_status) if progress_callback: progress_callback( f"Wiki generation complete ({ctx.pages_generated} generated, {ctx.pages_skipped} unchanged)", total_steps, total_steps, ) async def _generate_overview(self, index_status: IndexStatus) -> WikiPage: """Generate the main overview/index page with grounded facts.""" return await generate_overview_page( index_status=index_status, vector_store=self.vector_store, llm=self.llm, system_prompt=self._system_prompt, manifest=self._manifest, repo_path=self._repo_path, ) async def _generate_architecture(self, index_status: IndexStatus) -> WikiPage: """Generate architecture documentation with diagrams and grounded facts.""" return await generate_architecture_page( index_status=index_status, vector_store=self.vector_store, llm=self.llm, system_prompt=self._system_prompt, manifest=self._manifest, repo_path=self._repo_path, ) async def _generate_dependencies( self, index_status: IndexStatus ) -> tuple[WikiPage, list[str]]: """Generate dependencies documentation with grounded facts from manifest.""" return await generate_dependencies_page( index_status=index_status, vector_store=self.vector_store, llm=self.llm, system_prompt=self._system_prompt, manifest=self._manifest, import_search_limit=self.config.wiki.import_search_limit, ) async def _generate_changelog(self) -> WikiPage | None: """Generate changelog page from git history.""" return await generate_changelog_page(self._repo_path) async def _write_page(self, page: WikiPage) -> None: """Write a wiki page to disk asynchronously.""" import asyncio page_path = self.wiki_path / page.path content = page.content def _sync_write() -> None: page_path.parent.mkdir(parents=True, exist_ok=True) page_path.write_text(content) await asyncio.to_thread(_sync_write) async def generate_wiki( repo_path: Path, wiki_path: Path, vector_store: VectorStore, index_status: IndexStatus, config: Config | None = None, llm_provider: str | None = None, progress_callback: ProgressCallback | None = None, full_rebuild: bool = False, ) -> WikiStructure: """Convenience function to generate wiki documentation. Args: repo_path: Path to the repository. wiki_path: Path for wiki output. vector_store: Indexed vector store. index_status: Index status. config: Optional configuration. llm_provider: Optional LLM provider override. progress_callback: Optional progress callback. full_rebuild: If True, regenerate all pages. Otherwise, only regenerate changed pages. Returns: WikiStructure with generated pages. """ from local_deepwiki.core.git_utils import is_github_repo config = config or get_config() # Auto-switch to cloud provider for GitHub repos if configured effective_provider = llm_provider if effective_provider is None and config.wiki.use_cloud_for_github: if is_github_repo(repo_path): effective_provider = config.wiki.github_llm_provider logger.info( f"GitHub repo detected, using cloud provider: {effective_provider}" ) generator = WikiGenerator( wiki_path=wiki_path, vector_store=vector_store, config=config, llm_provider_name=effective_provider, ) return await generator.generate(index_status, progress_callback, full_rebuild)

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/UrbanDiver/local-deepwiki-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

wiki.py•39.5 KiB