《还山遗稿》服饰内容提取 · 工作日志
时间:2026-03-05 任务ID:batch6-3 操作人:Agent
操作流程
Step 1: 准备工作
mkdir -p /home/z/my-project/upload/四库别集output/还山遗稿
wc -l 还山遗稿.txt → 585行
Step 2: 读取参考文件
读取 参考/总结.md、参考/日志.md、参考/原文提取.md
→ 了解输出格式规范
Step 3: 多轮grep搜索
第1轮:宽泛搜索
rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|履|靴|袜' 还山遗稿.txt
→ 107行命中(大量噪音:颜色字、器物字泛用)
第2轮:精准搜索
rg -n '衣裳|衣冠|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|簪|钗|钿|珥|步摇|冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服' 还山遗稿.txt
→ 命中减少,但仍有噪音(衮衮=连续、冠氏=地名等)
第3轮:排除噪音
rg -v '衮衮|衣冠毕集|衣冠之幸|衣冠车马|冠氏|冠盖|挂冠|及冠|甫冠|弱冠|布衣|素志|青天|青山|白日|白头|白发|白云|白玉|黄金|金谷|金符|金帛|紫阳|紫阁|朱甍|翠微|丹青|佩刀|珥笔|丝竹'
→ 有效过滤后剩余约30条
第4轮:超精准制度词搜索
rg -n '章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|霞帔|翟衣|蚕服|舆服|冠服|革带|玉带|金带|冠冕' 还山遗稿.txt
→ 仅2条命中(章服、冕旒),说明本书无系统制度性服饰论述
Step 4: sed提取关键段落上下文
提取行号:117, 121, 131, 139, 147, 155, 156, 186-194, 207, 220, 387, 405, 449, 475, 489, 520, 533
逐条确认服饰内容,删除无关节选
Step 5: 分类整理
按7大类整理:
- 宫廷服饰与制度(4条)
- 妇女首饰与服饰(5条)
- 裘服与行役服饰(3条)
- 丝织与蚕桑(5条)
- 丧葬衣衾(1条)
- 道教服饰(4条)
- 礼仪与仕进服饰(3条)
Step 6: 写3个MD文件
- 总结.md(约8KB):分类总表+核心发现+总结
- 原文提取.md(约6KB):逐条原文+注释
- 日志.md(本文件):操作流程记录
关键发现
- 本书为文学别集,无专门服饰论述,所有服饰内容散见于诗文墓志
- 宫词八首是服饰含量最集中的部分(行186-194),描写金元宫廷女性首饰服饰
- 章服赐降将为元初军政制度的服饰实证
- 全真道士修行服饰(衣不解带、履袜经年不易)为道教史珍贵资料
- 蚕桑丝织多次出现,反映金元战乱中关中地区蚕桑经济状况
关键踩坑记录
- "冠氏"为地名(山东冠县),非冠服词汇,需排除
- "衮衮"为副词(连续不断),非衮服,需排除
- "衣冠毕集""衣冠之幸""衣冠车马"中"衣冠"为士大夫代称,非服饰描写,但"衣冠坐堂上"有服饰行为义,保留
- "锦溪"为书名(《锦溪集》),非锦缎,排除
- "组绣其辞"为比喻(辞藻如织绣),非实际服饰,归入文学描写
- "步障"在金谷行诗中但rg未检出,因原文含■〈毛瞿〉毺(OCR缺字),步障与毛毺均为织物
审核结果
全部通过 ✅ — 原文均从还山遗稿.txt中grep+sed提取,有明确行号对应。噪音已通过多轮过滤清除。