《贞素斋集》服饰内容提取 · 操作日志

时间:2026-04-17 任务ID:batch4-3 任务:提取《贞素斋集》全部服饰相关内容,整理分类总结


操作流程

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/贞素斋集

Step 2: 读取参考文件

读取3个参考MD(总结.md、日志.md、原文提取.md),确认输出格式规范。

Step 3: 源文件概况

wc -l 贞素斋集.txt → 1406行

文件规模适中,为元末明初舒頔的诗文集。

Step 4: grep多轮搜索

第一轮:基础服饰关键词(衣裳裘冠冕弁帻巾帽袍衫裙裤褐)

rg -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐" 贞素斋集.txt

返回大量结果,需进一步过滤。

第二轮:材质与色彩关键词

rg -n "衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑|朱|紫|绯|绿|翠" 贞素斋集.txt

颜色词噪音极大(白/青/黄等大量非服饰用法),需用复合词过滤。

第三轮:复合关键词精确搜索

rg -n "衣冠|衣裳|儒衣|儒冠|衣衾|深衣|大带|短褐|锦衣|紫袍|白袍|青巾|冠服|缟衣|羊裘|紫云裘|白玉佩|纡银衣绯|簪笏|戎衣|斑衣|绛帻|乌纱|朱衣|帽檐|霞帔|翟衣|蚕服|缁尘|锦袍|纱裾|紫霞裾|罗衣|布衣|衣衫|衣湿|衣襟|衣锦|赐服|补服|章服" 贞素斋集.txt

返回约60条精确匹配。

第四轮:高级服饰关键词

rg -n "衮衣|衮裳|冕|弁|帻|幞头|进贤冠|革带|玉带|鱼袋|品色|飞鱼|斗牛|蟒衣|舄|履|靴|袜|蔽膝|佩|笏|绶|步摇|簪|钗|钿|珥|金带" 贞素斋集.txt

补充发现:舄(王乔舄)、佩(白玉佩/鸣佩/佩蕙)、笏(簪笏/拄笏)、钗(宝钗)、履(双履/金莲)。

Step 5: 噪音过滤

排除以下类型的非服饰用例:

Step 6: 分类整理

按10大类整理:

  1. 衣冠与士族身份(10条)
  2. 官服与品级(10条)
  3. 冠帽巾帻(10条)
  4. 深衣大带与儒者礼服(2条)
  5. 丧乱中的衣衫(8条)
  6. 服饰意象与典故(20条)
  7. 妇人服饰与首饰(3条)
  8. 布衣——平民代称(4条)
  9. 冠盖——权贵代称(3条)

Step 7: 写3个MD文件


关键发现

  1. 纡银衣绯:元代六品武官品色服的珍贵实例——银带+绯衣,印证元代品色服制
  2. 深衣大带:元末民间女性(頔之从姑)仍守古制穿深衣大带,为儒者礼制的活态传承
  3. 冠服整肃沐浴外宿:祭祀前冠服礼仪的实践记录
  4. 衣冠陵替:元末明初士族衰落的标志性表述
  5. 衣衫尽剥脱裸身肉见赤:战乱中被劫剥衣的惨痛实录
  6. 青巾白袍/紫袍:赵匡胤微时与称帝后服色对比,为题画诗中的服饰叙事
  7. 儒冠一着道士服:儒道服饰转换的身份隐喻
  8. 短褐峩巾:元代学佛者的典型装扮
  9. 云髻宝钗:妇人首饰的少见描写
  10. 五花绫:民间丝织品名,反映纺织生产

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从源文件grep提取,有明确行号对应。3个MD文件均≤20KB。