《谦斋文录》服饰内容提取 · 操作日志
时间:2026-04-20 任务:提取《谦斋文录》全部服饰相关内容,整理分类总结 任务ID:batch2-5
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/谦斋文录/
✅ 目录创建成功
Step 2: 读取参考模板
读取 /home/z/my-project/upload/参考/总结.md(吕氏春秋模板)
读取 /home/z/my-project/upload/参考/日志.md(晋会要模板)
读取 /home/z/my-project/upload/参考/原文提取.md(天工开物模板)
✅ 了解格式要求:总结需分类论述+对抗式审查,日志需记录每步操作,原文提取需带行号
Step 3: 查看源文件基本信息
wc -l 谦斋文录.txt → 1337行
✅ 文件规模适中
Step 4: 第一轮关键词搜索——基础服饰词
grep -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐' 谦斋文录.txt
返回约80条匹配,需逐条过滤噪音(如"衣"在"衣食""无衣"等非服饰语境)
Step 5: 第二轮关键词搜索——织物与佩饰
grep -n '衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁' 谦斋文录.txt
返回约80条,大量为通用字("丝"在"一丝""钓丝"等非服饰语境)
Step 6: 第三轮关键词搜索——颜色与首饰
grep -n '素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇' 谦斋文录.txt
返回约80条,噪音极多("青"在"青山""青天"等非服饰语境),此轮筛选需格外谨慎
Step 7: 第四轮关键词搜索——制度术语
grep -n '冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|犀带|角带|幞头|乌纱' 谦斋文录.txt
返回约15条,信噪比最高。关键发现:
- 行104: "赐以玉带恩宠服色"
- 行432: "带乌纱"
- 行893: "飞鱼金织衣"
- 行1287: "赐麒麟衣金帯"
- 行1315: "金织蟒衣一袭"
Step 8: 第五轮关键词搜索——冠服专词
grep -n '进贤冠|貂蝉|獬豸|通天冠|远游冠|委貌冠|皮弁|韦弁|燕服|深衣|大带|鞶带|蔽膝|舄|履|靴|袜|亵衣|中衣|衫裙|袄|褙子|半臂|披帛|霞帔|命妇|翟衣|褕翟|阙翟|鞠衣|礼衣|蚕服' 谦斋文录.txt
返回极少,仅:
- 行951: "貂蝉金紫"
- 行1148: "霞帔翟冠"
Step 9: 精确化搜索——组合服饰词
grep -n '袍|冠|裳|佩|笏|绶|带|裘|簪|钗|帔|冕|弁|幞头|乌纱|补服|蟒衣|飞鱼|锦衣|赐服|绣衣|章服|朝服|公服|祭服|丧服|命妇|翟冠|霞帔|缊袍|青袍|鹭袍|绯袍|征袍|宫袍|宫罗|绮罗|纨绮|罗帕|文绣|文绮|金带|玉带|金织|彩衣|鹿衣|衮裳|羊裘|铁衣|铁面|豸冠|象简|貂蝉' 谦斋文录.txt
返回约100条,经人工筛选保留约60条真正服饰相关内容
Step 10: 筛选过滤
噪音过滤规则:
- "衣食"(生活泛指)→ 排除
- "青山""青天""青云"(非服饰颜色)→ 排除
- "白日""白金"(非服饰白色)→ 排除
- "黄金"单独出现(指金属而非装饰)→ 视语境保留
- "锦衣卫"(官署名非服饰)→ 排除
- "一丝""钓丝"(非丝织品)→ 排除
- "罗浮""罗浮山"(地名)→ 排除
- "锦为囊"(锦做袋子)→ 保留(锦织物用途)
Step 11: 分类整理
将保留的约40条有效服饰内容分为8大类:
- 官服制度与品色(10条)
- 赐服制度(6条)
- 命妇冠服(3条)
- 日常服饰(6条)
- 织物丝帛(6条)
- 孝道彩衣(6条)
- 服饰与政治伦理(6条)
- 神灵服饰与祭祀(4条)
Step 12: 撰写三份MD文件
- 谦斋文录_总结.md:结构化综述 + 对抗式学术审查
- 谦斋文录_原文提取.md:带行号的原始服饰匹配片段
- 谦斋文录_日志.md:本文件,完整操作记录
Step 13: 检查文件大小
wc -c 谦斋文录_总结.md
wc -c 谦斋文录_原文提取.md
wc -c 谦斋文录_日志.md
均须 < 20KB
关键发现
- 赐服体系完整:飞鱼服→麒麟服→蟒衣三级赐服均有记录,可印证《明史·舆服志》所载赐服制度
- 御史服饰详尽:豸冠、象简、绣衣、绯袍、白简——监察御史完整服饰组合仅在行726一处集中出现
- 命妇礼服典型:霞帔翟冠为明代命妇标准礼服,行1148为墓志铭中的制度性记录
- 老莱子彩衣反复使用:6次引用,是全书出现频率最高的服饰典故
- 安素子寓言有服饰哲学:缊袍与衮裳、文绣与韦布的对比,为全书最具思辨性的服饰论述
踩坑记录
- "衣"字噪音极大:全书记1337行,含"衣"字行约50+,但真正服饰相关仅约20行
- "罗"字地名干扰:"罗浮""罗浮山"为广东地名,与丝织品无关
- "锦衣卫"非服饰:多处出现"锦衣卫"为军事机构名,非"锦衣"服饰
- "白金"非白色服饰:明代"白金"指银两,非丝帛颜色
- "冠"字多义:"冠"可指冠帽,亦可指冠军、冠绝(行824"冠羣英"),需逐一辨别
- "带"字最复杂:可指腰带、携带、地带,"带乌纱"为服饰,"带雨飘"非服饰
审核结果
✅ 全部通过——原文均从源文件grep提取,有明确行号对应,噪音已人工过滤标注。