研究总结 日志 原文

刘宾客文集·服饰提取日志

处理时间:2026-05-09 14:54 源文件:/home/z/my-project/upload/四库别集/刘宾客文集.txt 输出目录:/home/z/my-project/upload/四库别集output/刘宾客文集/

处理流程

  1. mkdir:创建输出目录
  2. 五轮grep:按类别搜索服饰关键词
    • 第一轮:衣裳袍裘(衣|裳|袍|裘|袂|裾|襦|褂|衫|袄|褐)
    • 第二轮:冠冕弁巾(冠|冕|弁|巾|帽|帻|簪|缨)
    • 第三轮:锦绮帛绢(锦|绮|帛|绢|绫|罗|缎|绸|缯|纨)
    • 第四轮:丝麻葛布(丝|麻|葛|布|缟|绤|絺|纻)
    • 第五轮:履舄靴鞋制度词(履|舄|靴|鞋|袜|带|佩|章服|朝服|祭服|丧服|吉服|冠服|戎服|服制)
  3. sed提取上下文:每条匹配取前2后5行
  4. 过滤非服饰语境:去除地名等误匹配
  5. 生成MD文档:原文提取、总结、日志

处理结果

指标 数值
源文件总行数 2347
初始匹配行数 368
核心服饰条目 245
旁涉服饰条目 123

过滤说明

各类别匹配统计