研究总结 日志 原文

《谦斋文录》服饰内容提取 · 操作日志

时间:2026-04-20 任务:提取《谦斋文录》全部服饰相关内容,整理分类总结 任务ID:batch2-5


操作流程

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/谦斋文录/

✅ 目录创建成功

Step 2: 读取参考模板

读取 /home/z/my-project/upload/参考/总结.md(吕氏春秋模板)
读取 /home/z/my-project/upload/参考/日志.md(晋会要模板)
读取 /home/z/my-project/upload/参考/原文提取.md(天工开物模板)

✅ 了解格式要求:总结需分类论述+对抗式审查,日志需记录每步操作,原文提取需带行号

Step 3: 查看源文件基本信息

wc -l 谦斋文录.txt → 1337行

✅ 文件规模适中

Step 4: 第一轮关键词搜索——基础服饰词

grep -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐' 谦斋文录.txt

返回约80条匹配,需逐条过滤噪音(如"衣"在"衣食""无衣"等非服饰语境)

Step 5: 第二轮关键词搜索——织物与佩饰

grep -n '衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁' 谦斋文录.txt

返回约80条,大量为通用字("丝"在"一丝""钓丝"等非服饰语境)

Step 6: 第三轮关键词搜索——颜色与首饰

grep -n '素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇' 谦斋文录.txt

返回约80条,噪音极多("青"在"青山""青天"等非服饰语境),此轮筛选需格外谨慎

Step 7: 第四轮关键词搜索——制度术语

grep -n '冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|犀带|角带|幞头|乌纱' 谦斋文录.txt

返回约15条,信噪比最高。关键发现:

Step 8: 第五轮关键词搜索——冠服专词

grep -n '进贤冠|貂蝉|獬豸|通天冠|远游冠|委貌冠|皮弁|韦弁|燕服|深衣|大带|鞶带|蔽膝|舄|履|靴|袜|亵衣|中衣|衫裙|袄|褙子|半臂|披帛|霞帔|命妇|翟衣|褕翟|阙翟|鞠衣|礼衣|蚕服' 谦斋文录.txt

返回极少,仅:

Step 9: 精确化搜索——组合服饰词

grep -n '袍|冠|裳|佩|笏|绶|带|裘|簪|钗|帔|冕|弁|幞头|乌纱|补服|蟒衣|飞鱼|锦衣|赐服|绣衣|章服|朝服|公服|祭服|丧服|命妇|翟冠|霞帔|缊袍|青袍|鹭袍|绯袍|征袍|宫袍|宫罗|绮罗|纨绮|罗帕|文绣|文绮|金带|玉带|金织|彩衣|鹿衣|衮裳|羊裘|铁衣|铁面|豸冠|象简|貂蝉' 谦斋文录.txt

返回约100条,经人工筛选保留约60条真正服饰相关内容

Step 10: 筛选过滤

噪音过滤规则:

Step 11: 分类整理

将保留的约40条有效服饰内容分为8大类:

  1. 官服制度与品色(10条)
  2. 赐服制度(6条)
  3. 命妇冠服(3条)
  4. 日常服饰(6条)
  5. 织物丝帛(6条)
  6. 孝道彩衣(6条)
  7. 服饰与政治伦理(6条)
  8. 神灵服饰与祭祀(4条)

Step 12: 撰写三份MD文件

Step 13: 检查文件大小

wc -c 谦斋文录_总结.md
wc -c 谦斋文录_原文提取.md
wc -c 谦斋文录_日志.md

均须 < 20KB


关键发现

  1. 赐服体系完整:飞鱼服→麒麟服→蟒衣三级赐服均有记录,可印证《明史·舆服志》所载赐服制度
  2. 御史服饰详尽:豸冠、象简、绣衣、绯袍、白简——监察御史完整服饰组合仅在行726一处集中出现
  3. 命妇礼服典型:霞帔翟冠为明代命妇标准礼服,行1148为墓志铭中的制度性记录
  4. 老莱子彩衣反复使用:6次引用,是全书出现频率最高的服饰典故
  5. 安素子寓言有服饰哲学:缊袍与衮裳、文绣与韦布的对比,为全书最具思辨性的服饰论述

踩坑记录


审核结果

✅ 全部通过——原文均从源文件grep提取,有明确行号对应,噪音已人工过滤标注。