《陆清河集》服饰内容提取 · 操作日志
时间:2026-03-05 任务ID:batch16-4 任务:提取《陆清河集》全部服饰相关内容,整理分类总结
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/陆清河集
wc -l 陆清河集.txt → 1168行
Step 2: 读取参考文件
- 参考/总结.md → 《吕氏春秋》服饰总结格式:按类别分章,每条原文+注释
- 参考/日志.md → 《晋会要》操作日志格式:Step+命令+结果
- 参考/原文提取.md → 《天工开物》原文提取格式:分类+原文引用+行号
Step 3: 第一轮grep——基础关键词广搜
grep -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|履|靴|袜' 陆清河集.txt
结果:大量命中(单字噪音多),需二次过滤
Step 4: 第二轮grep——复合关键词精确搜索
grep -n '步摇|冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|霞帔|翟衣|蚕服' 陆清河集.txt
结果:仅1条命中(弁,行215),说明本书无系统性服饰制度记载
Step 5: 第三轮grep——双字+核心术语精确搜索
grep -n '衣裳|衣冠|裘|冠冕|弁|帻|巾帽|袍|衫|裙|裤|褐|衮|绶|佩玉|笏|锦|绮|绢|帛|丝绸|缎|绫|罗|纱|绉|缟|缁|素服|赤|青衣|黄衣|白衣|黑衣|朱衣|紫|绯|翠|金带|银|玉带|珠|簪|钗|钿|珥|步摇|冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服|冕|帢' 陆清河集.txt
结果:过滤后约30条有效命中
Step 6: 第四轮grep——核心服饰术语
grep -n '黄裳|朱衮|玄冕|紫黻|貂蝉|衮龙|黼黻|华虫|藻服|初服|缟带|裘不改|褐衣|褧裳|手衣|家人之服|繐帐|袭锦|垂缨|弹冠|振裳|黻冕|轻裘|玉帛|羔羊|束帛|端委|纡紫|袭轨|被裘|带索|玄服|缨' 陆清河集.txt
结果:精确定位到所有核心条目
Step 7: sed提取上下文
逐条用 sed -n 'Xp,Yp' 提取关键行上下文:
- 行485‑492(曹操遗物)
- 行241‑246(寒蝉赋)
- 行329‑330(荐张赡)
- 行681‑690(盛德颂/祖考颂)
- 行703‑706(荣启期赞)
- 行729‑732(宴会诗)
- 行265‑270(弹冠振裳/初服藻裳)
- 行285‑286(搴裳贝锦)
- 行847‑848(委弁释位)
- 行875‑876(羔羊玉帛)
- 行1009‑1013(褧裳/缟带)
- 行1072‑1073(解绂投簪)
- 行227‑228(黄裳振素)
- 行671‑672(解带)
- 行295‑296(家人之服)
Step 8: 分类整理
按5大类归并:
- 冕服制度与朝服仪饰(4条)
- 曹操遗物——纪实服饰记录(3条)
- 隐逸服饰(4条)
- 辞赋比兴中的服饰(13条)
- 政治服饰(2条)
Step 9: 写3个MD文件
- 总结.md(5,287字)——分类总结+分析
- 原文提取.md(4,016字)——行号+原文
- 日志.md(本文件)
关键发现
- 全书无系统性服饰制度记载:《陆清河集》为文学集,非史志,无舆服志式条目
- 行485‑487为唯一纪实材料:曹操遗物中介帻、平天冠、远游冠、手衣四项实物记录,为研究魏晋冠帻制度的珍贵文献
- 寒蝉赋(行245)集中反映晋人冕服认知:玄冕九旒、华虫朱衮、紫黻貂蝉、佩玉——虽为比兴,但可证晋人对天子服制的普遍认知
- "家人之服"(行295)可补正史:晋武帝日常穿普通人服装,与《晋书·舆服志》可互证
- 隐逸服饰成系统:被裘→解绂→投簪→披褐→委弁,构成完整的"弃官归隐"服饰叙事链
- "介帻如吴帻"值得深究:暗示吴地帻制与中原有别,可能反映三国时期地域服饰差异
噪音过滤记录
- 单字"衣/白/青/金/玉/素/紫/冠/带/佩"等大量出现于辞赋非服饰语境,已过滤
- "朱光""朱明""朱阳"为日色非服色,已排除
- "青林""青阳"为自然景观,已排除
- "金虎""金门""金鼓"非金饰,已排除
- "翠云""翠虬"为云色,已排除
- "玉阶""玉衡""玉舆"为器物非服饰,已排除
- "素心""抱素""素灵"为抽象概念,已排除
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应。噪音已人工二次过滤。