《还山遗稿》服饰内容提取 · 工作日志

时间:2026-03-05 任务ID:batch6-3 操作人:Agent


操作流程

Step 1: 准备工作

mkdir -p /home/z/my-project/upload/四库别集output/还山遗稿
wc -l 还山遗稿.txt → 585行

Step 2: 读取参考文件

读取 参考/总结.md、参考/日志.md、参考/原文提取.md
→ 了解输出格式规范

Step 3: 多轮grep搜索

第1轮:宽泛搜索

rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|履|靴|袜' 还山遗稿.txt
→ 107行命中(大量噪音:颜色字、器物字泛用)

第2轮:精准搜索

rg -n '衣裳|衣冠|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|簪|钗|钿|珥|步摇|冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服' 还山遗稿.txt
→ 命中减少,但仍有噪音(衮衮=连续、冠氏=地名等)

第3轮:排除噪音

rg -v '衮衮|衣冠毕集|衣冠之幸|衣冠车马|冠氏|冠盖|挂冠|及冠|甫冠|弱冠|布衣|素志|青天|青山|白日|白头|白发|白云|白玉|黄金|金谷|金符|金帛|紫阳|紫阁|朱甍|翠微|丹青|佩刀|珥笔|丝竹' 
→ 有效过滤后剩余约30条

第4轮:超精准制度词搜索

rg -n '章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|霞帔|翟衣|蚕服|舆服|冠服|革带|玉带|金带|冠冕' 还山遗稿.txt
→ 仅2条命中(章服、冕旒),说明本书无系统制度性服饰论述

Step 4: sed提取关键段落上下文

提取行号:117, 121, 131, 139, 147, 155, 156, 186-194, 207, 220, 387, 405, 449, 475, 489, 520, 533
逐条确认服饰内容,删除无关节选

Step 5: 分类整理

按7大类整理:

  1. 宫廷服饰与制度(4条)
  2. 妇女首饰与服饰(5条)
  3. 裘服与行役服饰(3条)
  4. 丝织与蚕桑(5条)
  5. 丧葬衣衾(1条)
  6. 道教服饰(4条)
  7. 礼仪与仕进服饰(3条)

Step 6: 写3个MD文件


关键发现

  1. 本书为文学别集,无专门服饰论述,所有服饰内容散见于诗文墓志
  2. 宫词八首是服饰含量最集中的部分(行186-194),描写金元宫廷女性首饰服饰
  3. 章服赐降将为元初军政制度的服饰实证
  4. 全真道士修行服饰(衣不解带、履袜经年不易)为道教史珍贵资料
  5. 蚕桑丝织多次出现,反映金元战乱中关中地区蚕桑经济状况

关键踩坑记录

审核结果

全部通过 ✅ — 原文均从还山遗稿.txt中grep+sed提取,有明确行号对应。噪音已通过多轮过滤清除。