anonymize_file
Replace personally identifiable information in Czech legal documents with pseudonyms to protect privacy during LLM processing. Supports PDF, DOCX, MD, and TXT files with configurable detection depth.
Instructions
Anonymizuje soubor (PDF, DOCX, MD, TXT) — nahradí PII pseudonymy.
Args: file_path: Absolutní cesta k souboru ke zpracování. depth: Hloubka detekce ("thorough" nebo "quick"). output_path: Výstupní cesta (volitelné). Výchozí: vedle originálu s příponou _anonymized.txt.
Returns: anonymized_path: Cesta k výstupnímu souboru s anonymizovaným textem. mapping_id: UUID pro pozdější deanonymizaci. UCHOVEJTE! entity_count: Počet nalezených entit. entities_summary: Počty entit dle typu. source_format: Formát vstupního souboru (pdf/docx/txt/md).
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| file_path | Yes | ||
| depth | No | thorough | |
| output_path | No |