《陈秋岩诗集》服饰内容提取 · 对话记录

时间:2026-03-05 任务ID:batch17-5 任务:提取《陈秋岩诗集》全部服饰相关内容,整理分类总结


操作流程

Step 0: 检查源文件

wc -l 陈秋岩诗集.txt → 498行

文件不大,但仍遵循严禁整本载入LLM的规则,采用grep+sed逐步提取。

Step 1: 读取参考模板

读取 /home/z/my-project/upload/参考/ 总结.md、日志.md、原文提取.md
确认输出格式:总结(分类论述)、日志(操作记录)、原文提取(逐条原文+注释)
文件大小限制:每个≤20KB

Step 2: 多轮grep搜索

第一轮:宽泛搜索(单字关键词)

grep -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|履|靴|袜"

命中行数过多,包含大量非服饰用法的颜色词、材质词(如"白云""青山")。

第二轮:精炼搜索(双字+组合关键词)

grep -n "衣裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|锦|绮|绢|帛|丝绸|缎|绫|罗|纱|绉|缟|缁|素衣|朱衣|紫衣|绯|翠|玉|珠|簪|钗|钿|珥|履|靴|袜|霞帔|翟衣|蚕服|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|深衣|大带|蔽膝|舄"

命中23行,质量显著提升。

第三轮:补充搜索(组合词+遗漏词)

grep -n "单衣裳|狐裘|翠裘|赐狐裘|貂蝉|乌巾|角巾|诗袍|缟衣|素衣|罗衣|霞衣|翠袖|绣襦|绮罗|旧毡|典衣|缝衣|垢衣|汉衣裳|金缕衣|寄衣|蒙茸|领袖|巾袂|节旄"

命中28行,基本覆盖所有服饰条目。

第四轮:验证性搜索

grep -n "赐|蟒|飞鱼|斗牛|朝服|公服|祭服|丧服|戎服|常服|貂|狐|毡"

确认无蟒衣、飞鱼、斗牛等明代赐服内容(符合元代诗集预期)。

Step 3: sed提取上下文

对每条命中行,用 sed -n 'N-2,N+2p' 提取上下文,确认诗题归属。

关键提取:

Step 4: 噪音过滤

剔除的噪音条目

保留的边缘条目(需注释说明):

Step 5: 分类整理

按7大类整理:

  1. 裘皮御寒(4条)
  2. 冠巾佩饰(6条)
  3. 衣裳本体(7条)
  4. 丝织品与织物(5条)
  5. 北方毡帐文化(5条)
  6. 服饰行为(5条)
  7. 服饰象征意象(4条)

Step 6: 保存三份文件

/home/z/my-project/upload/四库别集output/陈秋岩诗集/总结.md    ← 分类总结论述
/home/z/my-project/upload/四库别集output/陈秋岩诗集/原文提取.md ← 逐条原文+注释
/home/z/my-project/upload/四库别集output/陈秋岩诗集/日志.md     ← 本文件

关键发现

  1. "后赐狐裘"为全书唯一以服饰为题的诗——元朝近臣赐服制度的诗证
  2. "貂蝉"冠饰为重要制度信息——诗中"青紫貂蝉分不容"表明作者品级不够貂蝉冠
  3. 狐裘出现3次,是最高频服饰词——反映北方边塞御寒需求
  4. 毡车/毡帐出现4次——蒙元文化特色的物质文化记录
  5. "汉衣裳"意象——昭君出塞图中汉服染尘,民族服饰与文化认同
  6. 典衣/缝衣/寄衣——服饰行为反映的孝道与边塞生活
  7. 缺无冕、弁、帻、幞头、乌纱等官服体系——与作者为文人而非礼官的身份一致

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从四库本grep提取,有明确行号对应。噪音条目已过滤,边缘条目已加注释说明。