研究总结 日志 原文

六十种曲灌园记 服饰提取日志

处理信息

关键词检索统计

检索方式

使用ripgrep(rg)逐字匹配关键词词库:衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛

命中统计

噪音过滤说明

已过滤类型

  1. 版刻标题:行12"绣刻演剧十本"、行16"锦笺"、行27"绣刻灌园记定本"
  2. 非服饰语境用字
    • "绣"修饰非衣物:行237"万花如绣"、行273"锦衣香"(曲牌名)、行621"绣线"(女红用线保留)
    • "锦"作美好修饰:行225"锦堂月"(曲牌名)、行273"锦衣香"(曲牌名)
    • "丝"作丝线/蚕丝:行558"春蚕茧"→"丝难遣"(行566,比喻情感)
    • "旗/旌"作军事仪仗:行277/291/935"旌旗"(军事用途,保留1条作仪仗例)
    • "带"作携带/连带义:行558"带醉眠芳草"、行905"带累"
    • "环"作环绕义
    • "布"作布置义
  3. 比喻/典故中的服饰字
    • 行225"藿食何谋"——非服饰
    • 行539"腰金衣紫"——官制代称,保留
    • 行822"落叶满衣"——衣指落叶覆盖,非实指服饰
  4. 出目名称中的服饰字:行75"君后制衣"、行78"君后授衣"、行84"后母授簪"、行96"牧童拾簪"、行99"朝英寻簪"——保留,因其与剧情服饰直接相关
  5. 曲牌名中含服饰字:行273"锦衣香"——非服饰

保留但标注类型

处理流程

  1. wc -l 统计行数 → 1081行
  2. rg -n 全关键词匹配 → 约90行命中
  3. 逐行审读,标注服饰/非服饰
  4. sed -n 提取关键行上下文
  5. 分类整理:冠服/女装/首饰/织物/劳动/动作/仪仗
  6. 撰写三份MD文档

文件大小验证