《鄱阳集(宋洪皓)》服饰内容提取 · 日志

时间:2026-03-04 任务ID:batch10-2 操作:提取《鄱阳集(宋洪皓)》全部服饰相关内容,整理分类总结


操作流程

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/鄱阳集(宋洪皓)/

Step 2: 读取参考文件

读取 /home/z/my-project/upload/参考/ 下三个模板文件:

Step 3: 查看源文件

wc -l 鄱阳集(宋洪皓).txt → 351行

文件较小(351行),为四卷本,含诗、词、奏札、书信、杂文。

Step 4: grep多轮搜索(6轮)

第1轮:基础服饰词

grep -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐" → 30+行

第2轮:纺织品与颜色词

grep -n "衮|绶|佩|笏|带|锦|绮|绢|帛|丝绸|缎|绫|罗|纱|绉|缟|缁|素" → 30+行

第3轮:色与饰物词

grep -n "赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇" → 50+行(含大量噪音)

第4轮:制度与专有词

grep -n "冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服" → 6行(多为鞋履/裘服/丧服相关)

第5轮:组合词精准搜索

grep -n "鹖冠|儒冠|南冠|皮冠|侧弁|纱笼|绨袍|莱衣|翠云裘|羔裘|裘马|信衣|衣法|帻|巾" → 18行

第6轮:补充搜索

grep -n "鞾|靴|舄|珠|玉|银|金|锡|铁|铜|簪|钗|钿|珥|步摇|鱼袋|臂|囊" → 40+行
grep -n "彩衣|戏彩|衣裳|垂裳|丧服|丧纪|絰|衰|布衣|短褐|衫|袍|裙|裤" → 15行

Step 5: 过滤噪音

从上述grep结果中人工甄别,排除以下噪音类型:

过滤后有效服饰行:约30行。

Step 6: 分类整理

将有效内容分为9类:

  1. 冠帽类(6项):儒冠、鹖冠、南冠、弁、岸帻、折巾
  2. 衣袍类(8项):彩衣、垂裳、绨袍、青衫、丽服、衣绣、莱衣、信衣
  3. 裘皮类(3项):黑羔裘、翠云裘、裘马
  4. 鞋履类(3项):皮鞾、飞舄、剑履
  5. 佩饰类(6项):佩印、苍玉佩、绅笏、佩萸、簪花、萸囊
  6. 绶带类(1项):绿绶
  7. 纺织材料(6项):币帛、绮罗、玉帛、锦鞯、障泥锦、锦囊
  8. 礼仪制度(2项):剑履上殿、纱笼
  9. 象征意象:南冠、儒冠、绨袍、衣冠、莱衣

Step 7: 写3个MD文件


关键发现

  1. 全书以典故为主,少纪实:洪皓诗中服饰内容几乎全为用典,与《天工开物》《吕氏春秋》等制度性/工艺性文献形成鲜明对比。
  2. 南冠为第一意象:4次出现"南冠未税",频率最高,与其使金被留的身份处境直接相关。
  3. 裘服有北方纪实价值:黑羔裘、皮鞾等反映了金国寒冷环境下的实际穿着。
  4. 金国服饰观察仅1处:"丽服靓妆皆可玩"(第126行),直接描写金人服饰,极为珍贵。
  5. 佩饰多涉节俗:佩萸、萸囊、簪花均与重阳、宫廷宴饮等节令礼仪相关。

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从源文件grep提取,有明确行号对应,噪音已人工过滤。