# Claim Grouping 参数配置
# 复制此文件到 config.yaml 进行自定义
# Claim Grouping
claim_split_threshold: 150 # 触发拆分的组大小阈值 (当 max_group_size > 此值时拆分)
claim_target_size: 120 # 拆分后目标组大小
claim_max_per_doc: 100 # 每篇文档最大处理 claim 数
claim_top_k_per_group: 10 # 导出时每组返回的 top-k claims
# Taxonomy
taxonomy_general_threshold: 0.3 # general 占比警告阈值 (超过此值建议扩展词表)
# Topic Selection
topic_min_df: 3 # topic 最小文档频率 (df < 此值的 topic 可能太具体)
topic_selection_strategy: min_df # 选择策略: min_df (越具体越优先) | max_weight
# Relation Canonicalization
rel_qualifier_keys: sample_size,time_period,geography,industry # 保留的 qualifier keys