研究总结 日志 原文

《许黄门先生诗集》服饰内容提取 · 操作日志

时间:2026-04-19 任务ID:batch1-1 来源:《许黄门先生诗集》(明)许相卿 撰 · 四库别集


操作流程

Step 1: 创建输出目录

mkdir -p "/home/z/my-project/upload/四库别集output/许黄门先生诗集/"
→ 成功

Step 2: 读取参考模板

读取 /home/z/my-project/upload/参考/总结.md
读取 /home/z/my-project/upload/参考/原文提取.md
读取 /home/z/my-project/upload/参考/日志.md
→ 了解3个MD的格式规范

Step 3: 查看源文件基本信息

wc -l 许黄门先生诗集.txt → 1065行
wc -c 许黄门先生诗集.txt → 37,687字节(约37KB)
→ 文件不大,但严格遵守规则,不整本载入上下文

Step 4: 多轮grep检索服饰关键词

第一轮:基本服饰词(衣裳冠冕等)

rg -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带"
→ 返回大量结果(约80行),需逐一筛选

第二轮:织物颜色类关键词

rg -n "锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑|朱|紫|绯|绿|翠"
→ 返回大量结果,但多数为颜色词的非服饰用法(如"青山""白云""翠屏"),需严格过滤

第三轮:饰物鞋履蚕丝类

rg -n "金|银|玉|珠|簪|钗|钿|珥|履|靴|袜|舄|霞|翟|蚕|丝"
→ 多数为非服饰用法(如"玉龙""金山"),仅"簪""履"有服饰价值

第四轮:具体服饰品种

rg -n "纶巾|角巾|箨冠|高帽|葛巾|白纶|斗笠|布袍|短褐|敝裘|羊裘|衣裳|春袍|褐袍|衫衣|短布|芒鞵|青鞵"
→ 精准命中,返回17行核心服饰内容

第五轮:制度性服饰词汇

rg -n "冠服|朝服|祭服|丧服|常服|戎服|赐服|章服|鱼袋|补服|幞头|深衣|霞帔|命妇|翟衣"
→ 无结果(诗集不含制度性服饰词汇)

第六轮:补充服饰词

rg -n "被褐|布被|衾|绣|织|文绶|长裾|童冠|负弩|簪"
→ 补充"被褐""布被""残织""文绶""长裾""童冠""负弩""簪"等

第七轮:鞋履衣部件

rg -n "履|屐|屦|舄|袂|袪|襟|袖|裾|裙|带"
→ 补充"屐"5处、"履"1处、"袂"1处、"襟"2处、"袖"1处

Step 5: 用sed提取上下文

对37个匹配行号,使用 sed -n "$((line-2)),$((line+2))p" 提取前后2行上下文
→ 获得每条匹配的完整诗句和诗题

Step 6: 噪音过滤

过滤项 原因
"青山"(出现约20次) 山名/自然描写,非服色
"白云"(约10次) 自然景物,非织物
"翠屏""翠凌" 自然景物比喻
"玉龙""玉宇" 比喻,非玉器服饰
"金山""金闺" 地名/典故,非金饰
"缟屿"(L379) 缟作地名修饰,非缟素服饰
"游丝"(L759) 蜘蛛丝,非丝织品
"钓丝"(L862) 钓鱼线,非丝织品
"带清川""带路丛" 动词"带领",非腰带

Step 7: 分类整理

将保留的服饰内容按以下类别整理:

  1. 冠巾类(8条):角巾×3、白纶巾、箨冠、葛巾、高帽×2
  2. 裘衣类(5条):羊裘×2、敝裘、客裘、衣裘
  3. 袍衫布褐类(8条):布袍+斗笠、春袍、褐袍、短布衫衣、被褐、短褐、衫、衣裳
  4. 鞋履类(8条):巾屦、芒鞵、屐×5、履、青鞵
  5. 官服礼制类(5条):童冠、笏、文绶、冠剑、长裾、负弩
  6. 衣部细节类(6条):衣褒、振衣、衣振、扬袂、衣袖、敝缨、残织

Step 8: 撰写3个MD文件

文件 内容 大小控制
许黄门先生诗集_总结.md 服饰结构化综述+对抗式审查 <20KB
许黄门先生诗集_原文提取.md 带行号的原始服饰匹配片段 <20KB
许黄门先生诗集_日志.md 本文件,完整操作记录 <20KB

关键发现

  1. 角巾为核心服饰符号:出现3次,贯穿五言古至七言律,是许相卿"弃官归隐"身份的服饰标志
  2. 隐逸服饰体系完整:角巾+布袍/短褐+屐/芒鞵,构成明代隐士标准着装
  3. 裘衣与寒苦叙事绑定:5次裘衣描写均与客途困顿相关
  4. 官服碎片化回忆:笏、绶、冠剑、长裾等以回忆形式出现,暗示仕宦已成"大槐梦"
  5. 诗集无制度性服饰内容:不含冠服制度、舆服志式记载,纯为个人抒情中的服饰意象
  6. 自然染衣美学:"苔翠上衣裘""衫浥岚光"体现独特的服饰自然观
  7. 葛巾漉酒直承陶渊明:最明确的隐逸传统继承标志

关键踩坑记录