研究总结 日志 原文

《全元曲杂剧》服饰内容提取日志

基本信息

项目
输入文件 /home/z/my-project/upload/剧曲/剧曲/全元曲杂剧.txt
输出目录 /home/z/my-project/upload/剧曲output/全元曲杂剧/
书名 全元曲杂剧
总行数 29,595行
文件大小 5.9MB
处理时间 2026年3月4日

操作记录

步骤1:文件基本信息获取

步骤2:关键词命中统计

对44个服饰关键词逐一执行 rg -c 统计,结果如下:

关键词 命中行数 关键词 命中行数 关键词 命中行数
953 73 168
1279 249 32
13 117 69
1 7 35
5 57 131
26 0 8
71 0 31
143 35 503
114 28 45
489 619 70
127 460 196
216 33 9
3 20 3
30 26 0
0 0 0
3 12 167
14 232 66
3 14

零命中关键词:弁、珥、绂、黼、黻、鹖(6个)

步骤3:实质性服饰段落提取

3.1 袍(249命中)

3.2 裙(131命中)

3.3 冠/巾/裘/簪/履/绶/帻等

3.4 复合词专项搜索

步骤4:内容分类与整理

将提取内容按8大类组织:

  1. 官服制度(紫袍/绿袍/靴笏襕袍/紫绶金章/凤冠霞帔)
  2. 女性服饰(裙装/头面首饰/整体妆扮)
  3. 文士服饰(寒儒/隐逸/布衣与显达)
  4. 武将戎装(战袍铠甲/民族武服/军旅仪仗)
  5. 赐衣与赠衣(绨袍/割袍/御赐衣冠)
  6. 日常与平民服饰

步骤5:文件输出

文件 大小控制 内容
全元曲杂剧_总结.md ≤20KB 分类综述+关键原文引用+学术审查+总结表
全元曲杂剧_原文提取.md ≤20KB 带行号原始片段+分类分组+关键词加粗
全元曲杂剧_日志.md ≤20KB 完整操作记录

过滤规则说明

  1. 非服饰义过滤:如"地带""带领""局势""柳絮"等非服饰义用法已排除
  2. 重复过滤:同一服饰描写在不同折中重复出现时,仅保留最完整版本
  3. 修辞过滤:纯粹比喻用法(如"锦心绣口")不纳入,但"锦衣""绣鞋"等实指保留
  4. 代表性选取:同类描写(如多处"紫袍")选取最有细节者,不穷举

难点与备注

  1. "带"字命中率最高(1279),但大量为动词/地名用法,需逐一甄别
  2. "衣冠"复合词兼具服饰义和身份义(如"衣冠之士"),按语境判定
  3. 元杂剧特殊用语:如"虎磕脑"(虎形头盔装饰)、"夜叉裙"(丑角裙)等特有名词需保留
  4. 民族服饰:元代杂剧中番汉服饰交融(貂裘/鹔鸘裘/暖帽)反映时代特色
  5. 靴笏襕袍为元代状元标准装束,文献价值高