《雪坡集》服饰内容提取 · 操作日志

时间:2026-04-20 任务ID:batch20-4 操作员:AI Agent


操作流程

Step 1: 环境准备

mkdir -p /home/z/my-project/upload/四库别集output/雪坡集
wc -l 雪坡集.txt → 2588行

Step 2: 读取参考文件

/home/z/my-project/upload/参考/总结.md → 吕氏春秋服饰总结(261行)
/home/z/my-project/upload/参考/日志.md → 晋会要操作日志(84行)
/home/z/my-project/upload/参考/原文提取.md → 天工开物原文提取(165行)

结论:参照日志格式记录流程,总结采用分类+表格,原文提取按主题分节附行号。

Step 3: grep多轮搜索

第1轮:复合服饰词(精准搜索)

grep -n '衣裳\|赐衣\|授衣\|衣钵\|衣冠\|布衣\|缊袍\|鹄袍\|绿袍\|赭袍\|锦袍\|衮衣\|龙袍' → 16条
grep -n '深衣\|大带\|笏\|槐笏\|绶\|紫绶\|绿绶\|银鱼\|金鱼\|鱼袋\|幞头\|舄\|履舄\|靴\|袜\|丝鞭\|金带\|玉带\|革带' → 15条
grep -n '狐裘\|羔裘\|弊裘\|褐衣\|短褐\|丝帛\|绢帛\|绫罗\|锦绮\|纱罗\|缟素\|缁衣\|紫袍\|绯鱼\|银鱼\|金鱼\|鱼袋\|簪缨\|簪裳\|步摇\|霞帔\|蚕服\|朝服\|祭服\|丧服\|常服\|章服\|公服' → 22条
grep -n '缁衣\|簪缨\|冠礼\|加冠\|蟒衣\|补服\|青衿\|子衿\|黼黻\|文绣\|左衽\|丝帛\|锦绮\|纱罗\|绫罗\|方袍\|圆顶\|布裙\|荆钗\|罗裙\|翠袖\|红裙\|霓裳\|翟茀\|鱼轩\|宝钗\|燕钗' → 28条
grep -n '衮冕\|冕旒\|冠带\|佩玉\|簪笏\|赐紫\|赐绯\|绯袍\|朱衣\|朱紫\|文绣\|衣钵\|荷衣\|芰荷\|左衽\|霓裳\|黄衣\|赭黄\|赭袍\|玉笏\|槐笏\|白简\|象笏\|银绯\|银青\|金紫\|紫泥\|章甫\|峨冠\|博带\|衣冠' → 35条

第2轮:单字高频词筛选(已排除纯虚词噪音)

grep -n '衣\|裳\|裘\|袍\|衫\|裙\|褐\|衮\|绶\|笏\|佩\|带\|冠\|冕\|弁\|巾\|帽\|幞\|纱\|绫\|罗\|绢\|帛\|丝\|锦\|绮\|缟\|缁\|簪\|钗\|钿\|珥\|履\|舄\|靴\|袜\|霞帔\|翟' → 702行(含大量噪音)
→ 仅作辅助参考,以第1轮精准结果为主

Step 4: sed提取关键行上下文

对每条精准匹配,读取前后文确认服饰语境,剔除以下噪音:

过滤后有效服饰条目:约60条

Step 5: 分类整理

将60条有效内容归入9大类别:

  1. 朝服与品级服饰(天子赭袍、衮衣、官品服色等)
  2. 冠帽与头饰(幞头、吟帽、宝钗等)
  3. 士人服饰(青衿、深衣大带、荷衣等)
  4. 女性服饰(象服、翟茀、霓裳、罗裙等)
  5. 笏板与佩饰(槐笏、丝鞭、鱼袋等)
  6. 纺织与丝织品(锦、鲛绡、黼黻文章等)
  7. 僧道与特殊服饰(圆顶方袍、氅衣等)
  8. 典故服饰(周公衮衣、葛巾漉酒、老莱斑衣等)
  9. 仪制相关(冠礼、册立、赐服等)

Step 6: 输出三份文件


关键发现

  1. 槐笏工艺记述最详(L1954):记京师朝天门富宁制笏为第一,详述笏之形制象征(圭锐象仁、砥平象义、润象洁、直象刚),并引魏徵谏笏、段秀实击贼笏为典范,为集中最有服饰器物学价值的条目。
  2. 青衿学服制度(L302):释《诗·子衿》"青青子衿"为学子入学之服,"青东方木也,木属仁,古之学者以求仁为第一事故入学之服皆服青",为宋代学服色彩制度的重要注解。
  3. 赭袍黄屋帝服(L884、L2285):两处提及帝服赭黄色,为南宋帝服色彩的实际记录。
  4. 幞头赠诗(L587):专门写赠幞头之诗,反映宋代文人日常以幞头为赠品的社交习俗。
  5. 圆顶方袍僧服(L2381):"圆顶方袍"为僧人标准服饰描述,圆顶即落发,方袍即僧衣。
  6. 衮衣典故高频:衮衣作为宰辅归朝的象征,在启札中反复使用(L1340、L2307),反映宋人对周公衮衣归的典故熟知。
  7. 女性服饰多在词作:霓裳、罗裙、宝钗、翠袖等几乎全出现在词作中,用于描写歌舞、婚嫁场景。

踩坑记录