研究总结 日志 原文

《全元散曲》服饰提取操作日志

基本信息


操作步骤记录

步骤1:文件统计与目录创建

步骤2:关键词命中统计(分批grep)

批次1(衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环)

关键词 命中行数
349
50
86
295
83
35
5
50
35
6
4
13
11
79
153
30
0
7
134
2
48
103

批次2(绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛)

关键词 命中行数
77
461
213
2
9
662
410
34
127
121
95
252
36
0
0
9
25
83
8
0
2
2
0
3
5
181
7
95
23
9
9

步骤3:逐类提取服饰描写段落

执行以下grep命令提取实质服饰内容:

  1. rg -n "衣冠|衣裳|布衣|锦衣|罗衣|绯衣|紫衣|白衣|青衣|黄衣|衣裉|衣袂|衣带|脱衣|更衣|换衣|裁衣|征衣|朝衣" → 50+行
  2. rg -n "罗袍|紫袍|龙袍|朝袍|布袍|麻袍|锦袍|纱袍|衣袍" → 30+行
  3. rg -n "簪花|簪冠|玉簪|金簪|银簪|翠簪|宝簪|琼簪" → 40+行
  4. rg -n "绛绡裙|罗裙|翠裙|红裙|湘裙|唐裙|裙纱|裙儿|裙掩" → 30+行
  5. rg -n "帷|帐|幄|旗|旌|旆|纛" → 40+行
  6. rg -n "冠|弁|冕|帻" (过滤"冠军|冠世|冠绝")→ 40+行
  7. rg -n "貂裘|裘|轻裘|敝裘" → 20+行
  8. rg -n "绶|绂|黼|黻|珥|鹖|帻" → 15+行
  9. rg -n "纨|绡|绫|缯|绢|帛" → 20+行
  10. rg -n "绿蓑衣|蓑衣|草衣|鹤氅|羽衣|六铢衣" → 25+行
  11. rg -n "翠袖|红袖|彩袖|舞袖|衫袖|窄袖|宽袖|长袖|短袖|袖手|两袖" → 30+行
  12. rg -n "金莲|凌波袜|绣鞋|弓鞋|罗鞋|红罗鞋|鞋儿|凤头鞋" → 20+行
  13. rg -n "金鱼玉带|紫绶金章|玉带|金带|银带|犀带|革带|束带" → 20+行
  14. rg -n "直裰|短褐|褐衣|褐夫|道袍|僧衣|法衣|衲衣" → 10+行
  15. rg -n "藕丝裳|缃裙|红锦帔|花布直裰|皂头巾|草衣木食|粗布裘|白苎|白纻" → 12+行
  16. rg -n "佩玉|环佩|鸣珰|金环|玉环|银环|佩环|解佩|遗佩" → 20+行
  17. rg -n "皂|缟|素衣|白衣|青衫|乌纱|皂巾|角巾|纶巾|华阳巾|逍遥巾" → 20+行
  18. rg -n "绣帏|绣帘|绣幕|绣帐|绣被|绣衾|绣枕|绣带|绣鞋|绣鞍|绣芙蓉" → 25+行
  19. rg -n "锦帐|锦被|锦衾|锦袍|锦衣|锦带|锦屏|锦阵|锦笺|锦书|锦字|锦堂" → 25+行
  20. rg -n "黄袍|柘黄|衮龙|龙衣|衮衣|蟒袍|绯衣|紫袍" → 10+行

步骤4:过滤与精选

过滤原则

精选结果

步骤5:输出文件生成

  1. 全元散曲_总结.md:分类综述+关键词统计+学术审查+总结表
  2. 全元散曲_原文提取.md:带行号原始片段,分类分组,关键词加粗
  3. 全元散曲_日志.md:本文件,完整操作记录

数据质量说明

  1. 本文件11566行,体量较大,采用分批grep而非全文加载方式处理
  2. 高频词(锦662、罗461、绣410)存在大量非服饰义用法,已人工甄别过滤
  3. "衣冠"一词既可指实际穿着,也可指官员阶层("衣冠济楚"),分类时已加注释
  4. 散曲体制决定服饰描写多为意象化点染,少见具体形制描写,与戏曲剧本不同
  5. 元代散曲反映的服饰信息以汉族传统为主,蒙古服饰元素极罕见
  6. "白苎"在散曲中既指白苎衫,也指《白苎歌》曲调名,需区分

关键发现

  1. 官服—隐服对举为元散曲最突出的服饰母题,反映元代文人仕隐矛盾
  2. 罗衣宽褪为闺情曲固定修辞,"宽"字直指相思消瘦
  3. 弓鞋金莲反映元代缠足已普遍,散曲中有具体尺寸描写("半折""多三指")
  4. 簪为信物:玉簪折断=分离,为散曲核心意象
  5. 布袍蓑衣构成隐士标准装扮,与紫罗袍形成价值对立
  6. 白苎为南方特有服饰材质,散曲中常与歌咏关联