《雪矶丛稿》服饰内容提取 · 工作日志

时间:2026-03-05 任务ID:batch21-4 来源:四库全书·集部·别集类·《雪矶丛稿》[宋]乐雷发撰 输入:/home/z/my-project/upload/四库别集/雪矶丛稿.txt(37,616字节,376行) 输出:/home/z/my-project/upload/四库别集output/雪矶丛稿/


操作流程

Step 1: 环境准备

mkdir -p /home/z/my-project/upload/四库别集output/雪矶丛稿
读取参考文件:总结.md / 日志.md / 原文提取.md(三份参考模板)
源文件概况:37,616字节,376行,五卷诗集

Step 2: grep多轮检索

第一轮:核心服饰词

rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐' 雪矶丛稿.txt
# 命中:26,36,67,69,73,75,102,152,166,181,205,219,221,250,267,273,275,280,287,291,302,316,321,341,343,362

第二轮:配饰与制度词

rg -n '衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁' 雪矶丛稿.txt
# 命中:24,26,36,79,83,110,112,126,130,152,172,174,179,183,209,221,254,265,275,287,291,311,314,316,318

第三轮:颜色与首饰词

rg -n '赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥' 雪矶丛稿.txt
# 命中大量(颜色词在诗中极常见),需人工过滤

第四轮:专有服饰术语

rg -n '布衣|枲衣|荷衣|薜荔|衿|袂|纫|绣|緼袍|青袍|白袍|征衣|单衣|深衣' 雪矶丛稿.txt
# 命中:26,36,67,69,91,102,152,172,181,205,219,221,273,275,291,302,304,307,316,321,341,343,362

第五轮:官服仪仗术语

rg -n '黄绶|黄帽|桐帽|貂冠|幅巾|乌帽|白铜鞮|朱幡|皂葢|碧幢' 雪矶丛稿.txt
# 命中:30,73,75,118,126,158,172,321

第六轮:首饰装饰品

rg -n '金条脱|红绶|藕丝|璎珞|金缯|银菟|翠云' 雪矶丛稿.txt
# 命中:24,187,223,256

第七轮:补充检索

rg -n '韋布|韦布|舄|履|靴|袜|霞帔|翟衣|蚕服|朝服|祭服|丧服' 雪矶丛稿.txt
# 命中:362(韦布)、100/368(履)、215(青鞵)、339(玉簮)

Step 3: 噪音过滤

过滤原则:

过滤结果:

Step 4: 诗题定位

对每条命中行,沿原文向上追溯诗题与卷次。主要方法:

rg -n '^[  ]' 雪矶丛稿.txt  # 提取所有诗题行

Step 5: 分类与写文件

按8大类整理:

  1. 儒家礼服(4条)
  2. 官服制度(9条)
  3. 隐士服饰(6条)
  4. 行旅寒服(7条)
  5. 仙道装饰(7条)
  6. 仪仗配饰(6条)
  7. 纺织材料(6条)
  8. 其他零句(9条,含鹴裘犊鼻、畦衣、青鞵、履痕、衿佩、玉簮、振衣、衣袂、峻履)

输出3个文件:


关键发现

  1. 深衣大带为核心意象:《乌乌歌》以"深衣大带讲唐虞"对比"长缨系单于",是全书最具批判性的服饰书写,反映南宋士人对空谈误国的反思
  2. 隐士服饰最为丰富:布衣、荷衣、薜荔衣、幅巾等出现6次,与乐雷发终身不仕的身份一致
  3. 行旅寒服突出:枲衣、征衣、单衣、征衲等7条,反映诗人辗转湘桂间的清寒生活
  4. 无制度性记载:全书无舆服志、丧服等制度内容,所有服饰均为诗歌意象
  5. 仙道服饰集中于卷一:金条脱、璎珞、藕丝帬等仅见于歌行体,属浪漫想象
  6. 衮龙衣仅一见:道乡(邹浩)牵损衮龙衣,用典而非写实

踩坑记录


审核结果

全部通过 ✅ — 原文均从四库本TXT中grep提取,有明确行号对应,噪音已过滤。