《六十种曲·南柯记》服饰提取日志

生成时间:2026-05-11 14:19:54

1. 文件信息

2. 关键词词库

衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛

3. 逐关键词命中统计

关键词 命中行数 备注
46 含多义用法,已过滤
2
10
33 含'带领''带管'等非服饰用法
11
0 无命中
0 无命中
7
2
0 无命中
0 无命中
0 无命中
0 无命中
0 无命中
4
0 无命中
34 34次中绝大多数为'周弁'人名
2
3
0 无命中
7
7
1
23
9
1
2
25
25
3
2
4
1
9
0 无命中
0 无命中
0 无命中
1
0 无命中
0 无命中
2
0 无命中
0 无命中
0 无命中
0 无命中
1
0 无命中
9
1
18 多指旗帜仪仗
6
0 无命中
0 无命中

4. 噪音过滤规则

  1. 周弁:人名,弁字虽有冠义但此处为姓名,全部过滤
  2. :动词用法(带领/带管/地带)已排除,仅保留服饰用法
  3. :2次均为"絮叨",非"棉絮",已过滤
  4. :含曲牌名"捣练子",仅保留织物义
  5. :18次多为仪仗旗帜,归入旗帜帷帐类

5. 分类统计

6. 高频服饰词汇TOP10

  1. 紫衣(25次)
  2. 金钗(8次)
  3. 锦绣(6次)
  4. 画眉(6次)
  5. 朝衣(5次)
  6. 金莲(4次)
  7. 金凤钗(4次)
  8. 朱衣(3次)
  9. 锦衣(3次)
  10. 绣帘(3次)

7. 出次分布

8. 处理流程

  1. wc -l → 1028行
  2. 多轮 rg -n 匹配42个关键词 → 261行原始命中
  3. 过滤周弁人名等噪音 → 142行有效命中
  4. 复合词精确匹配(朱衣/紫衣/金凤钗等) → 121条服饰条目
  5. 按8类分类,按出次排序输出

9. 输出文件

文件名 大小 说明
总结.md ~5.5KB 服饰分类总结与意象分析
原文提取.md ~18KB 按出次排列的服饰原文摘录
日志.md ~4KB 提取过程与统计日志