《铁庵集》服饰内容提取 · 工作日志
任务ID: batch14-1 时间:2026-03-04 来源:/home/z/my-project/upload/四库别集/铁庵集.txt 输出:/home/z/my-project/upload/四库别集output/铁庵集/
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/铁庵集
wc -l 铁庵集.txt → 982行
Step 2: 读取参考文件
读取 /home/z/my-project/upload/参考/总结.md(吕氏春秋·服饰)
读取 /home/z/my-project/upload/参考/日志.md(晋会要·服饰)
读取 /home/z/my-project/upload/参考/原文提取.md(天工开物·服饰)
→ 掌握输出格式:总结/日志/原文提取 三文件结构
Step 3: 多轮grep检索
第一轮:基础服饰词
grep -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带'
→ 74行匹配
第二轮:材质色彩词
grep -n '锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑'
→ 161行匹配(噪音极高,白/青/黄/黑等颜色词大量出现在非服饰语境)
第三轮:贵重饰物词
grep -n '朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇'
→ 101行匹配(金/玉/紫等亦有大量非服饰噪音)
第四轮:服饰专有名词
grep -n '冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服'
→ 21行匹配(精度最高)
第五轮:高价值复合词
grep -n '赐衣带|赐绯鱼|命服|紫袍|绯鱼袋|金紫|银青|冠冕|衮线|佩玉|垂裳|束带|幞头|深衣|布衣帛冠|貂裘|绨袍|轻裘缓带|冠裳|韦布|青衫|缙绅|搢笏|垂绅|绣衣|墨绶|黄袖|缇屏|舄|鱼袋|貂|茧'
→ 获取核心服饰文献
Step 4: sed提取上下文
对关键行号(25, 55, 103, 189-190, 208, 224, 252, 281, 304, 334, 351, 353, 443, 477, 494, 618, 661, 678, 689, 773, 777, 797, 823, 941, 956)提取完整上下文
→ 逐一审读,过滤噪音
Step 5: 噪音过滤
过滤规则:
- "紫阳"→朱熹号,非服色,标记为参考
- "青箱"→典籍名,非服饰
- "青史"→史册,非服饰
- "黄袖"→为官署服色标识,保留
- "缇屏"→缇骑屏卫,非服饰主体,保留作参考
- "舄鳬"→舄为鞋,鳬舄用典,保留
- "画绣"→官服绣纹,保留
- "茧庵"→隐喻用,保留作参考
- "菟裘"→隐居之喻,保留
过滤结果:
- 从约300条grep原始匹配中筛选出约35条有效服饰内容
- 最终归纳为9大类、25+条有效记录
Step 6: 分类整理
按主题分为:赐服制度、冠服等级、官服品色、祭服礼制、裘服御寒、隐逸服饰、政治伦理、纺织材料、总结
关键发现
- 《谢赐衣带表》是全书最重要的服饰文献:集中涉及命服、赐带(金带紫袍)、衮线、锡鞶、在笥等多项制度,为宋代言官赐服的珍贵实录
- 祭服修制记录(行773):南宋嘉定间延平府学宫按淳熙类编式修补祭服,耗金前之半,为地方礼制实证
- 赐绯鱼袋(行956):方大琮知将乐县时获赐,体现宋代县令亦可获此殊荣
- 金紫封赠传统(行797、823、956):方氏始祖廷范赠金紫光禄大夫,世代以此为荣,服饰成为家族荣耀的象征
- 幅巾野服(行823):方氏福平公着幅巾野服行走乡间,为宋代乡居士人服饰的鲜活记录
- 布衣帛冠(行25):引用《左传》卫文公典,以服饰简陋反衬立志之坚
- 羔裘之大夫(行661):引用《诗经》典,讨论殷末三仁的服饰与政治伦理
关键踩坑记录
- 文集中"衣""冠"出现频繁,但大量用于比喻(如"衣冠礼乐""衣冠忿怨"),需区分具象服饰与抽象概念
- "紫"字出现较多,但多数为"紫阳"(朱熹号)、"紫殿"(道观),非直接服色
- "金紫"在方氏族谱中反复出现,实为封赠官衔而非具体服饰描述,但反映服饰等级制度
- "绶""带""佩"等词多有隐喻用法(如"襟带""佩玉锵鸣"),需结合语境判断
- "茧""菟裘"等为文学隐喻,非直接服饰记载,但反映服饰观念
文件清单
| 文件 | 大小 | 内容 |
|---|---|---|
| 总结.md | ~7KB | 九大类分类总结 + 关键词解析 |
| 日志.md | 本文件 | 操作流程与发现记录 |
| 原文提取.md | ~8KB | 按主题整理的原文摘录 |
审核结果
全部通过 ✅ — 原文均从铁庵集.txt中grep+sed提取,有明确行号对应。噪音已过滤,分类清晰。