《诚斋集》服饰内容提取 · 操作日志
时间:2026-04-17 任务ID: batch1-3 任务:提取《诚斋集》TXT文件中与服饰相关的内容,产出3个MD文件
操作流程
Step 1: 准备工作
mkdir -p /home/z/my-project/upload/四库别集output/诚斋集/
wc -l /home/z/my-project/upload/四库别集/诚斋集.txt
→ 11908行
Step 2: 读取参考模板
- 读取
/home/z/my-project/upload/参考/总结.md(吕氏春秋模板) - 读取
/home/z/my-project/upload/参考/日志.md(晋会要模板) - 读取
/home/z/my-project/upload/参考/原文提取.md(天工开物模板)
Step 3: 第一轮关键词搜索——核心服饰词
rg -n "衣[裳裘袍衫褐衮]" 诚斋集.txt → 约30条有效匹配
rg -n "冠[服冕弁巾帽]" 诚斋集.txt → 约15条有效匹配
rg -n "朝服|公服|祭服|丧服|常服|戎服|赐服|章服|冠服|舆服" → 8条
Step 4: 第二轮关键词搜索——品级与材质
rg -n "裘|袍|衫|裙|裤|褐|衮|绶|佩|笏|带" → 约100条(含大量噪音)
rg -n "锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素" → 约100条(含大量修辞用法)
rg -n "簪|钗|钿|珥|步摇|玉|珠|金|银|翠" → 约100条(多数为文学修辞)
Step 5: 第三轮关键词搜索——复合词与特定名词
rg -n "赤|朱|紫|绯|绿|青|黄|白|黑" | rg "衣|裳|袍|衫|裙|冠|冕|服|带|佩|绶"
→ 约30条有效
rg -n "幞头|乌纱|进贤冠|貂蝉|深衣|大带|蔽膝|舄|履|靴|袜|褙子|霞帔|翟衣|蚕服"
→ 约15条
rg -n "蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|犀带|角带"
→ 约5条
rg -n "赐服|赐衣|章服|冠服|祭服|丧服|冕|弁|衮衣|衮服"
→ 约15条
rg -n "绣衣|绣袍|笏|象笏|竹笏"
→ 约15条
Step 6: sed提取关键行上下文
sed -n '28p' → 深衣折角巾
sed -n '46p' → 锦囊绣衣侍臣冠
sed -n '5451p' → 赐章服答诏
sed -n '7682,7695p' → 谢赐衣带表
sed -n '8250,8265p' → 赐衣冠谢启
sed -n '9505,9510p' → 祭服原文
sed -n '9362,9370p' → 服周之冕
sed -n '9650,9655p' → 不税冕而行
sed -n '11525,11535p' → 冠服增秩
sed -n '11426,11435p' → 衮冕
sed -n '11865,11875p' → 冠冕一时
sed -n '8869,8872p' → 弁冕端委
Step 7: 筛选过滤
- 保留:真正涉及服饰制度、品级、材质、穿戴、赐服的条目
- 过滤:纯修辞用法(如"锦心""珠玑"喻文才)、自然景物比喻(如"翠屏"指山)
- 争议处理:"素衣成缁"虽化用古诗,但含服饰染色观念,保留
Step 8: 分类整理
按7大类整理:
- 冠服制度与品级服饰
- 冠帽
- 衣裳与材质
- 颜色与服饰象征
- 佩饰与仪仗
- 服饰哲学与伦理
- 综合
Step 9: 撰写MD文件
- 诚斋集_总结.md:结构化综述(约12KB)
- 诚斋集_原文提取.md:带行号的原始匹配片段
- 诚斋集_日志.md:本文件
关键发现
- 《诚斋集》服饰内容以诗歌比喻为主,非制度性专论,与《晋会要》《天工开物》性质不同
- 赐衣带表启最具文献价值:详细记载南宋赐服礼仪(宫衣、金带、鞍马并赐)
- 冠服政治事件:冠服增秩封还(L11527)、赐章服争议(L5451)为重要制度史料
- 品级服饰佐证:绯衣鱼袋(L8867)、金鱼玉带(L2529)、赤舄象笏(L6824)等
- 仕隐服饰对比为杨万里核心意象:荷衣/宫衣、韦带/金带、破褐/锦衣
- "祭服之尊"议论(L9507)为集中少有的服饰伦理专论
关键踩坑记录
- 丝织品关键词(锦、绢、罗、纱等)大量出现在诗词比喻中,需逐一甄别
- "缁""素"常作颜色修辞而非服饰实指,需结合语境判断
- "冠"字多作动词"冠绝"使用(如"冠南蛮"),需过滤
- 部分"衣"字为"衣钵"等固定搭配,非服饰
- 诚斋集为诗文集而非典制书,服饰信息密度远低于会要、舆服志类文献
审核结果
全部通过 ✅ — 原文均从诚斋集.txt用grep+sed提取,有明确行号对应。已过滤纯修辞噪音,保留真正服饰相关内容。