《集千家注杜工部诗集》服饰内容提取 · 对话记录

时间:2026-04-20 任务ID: batch20-1 任务:提取《集千家注杜工部诗集》全部服饰相关内容,整理分类总结


操作流程

Step 1: 准备工作

mkdir -p /home/z/my-project/upload/四库别集output/集千家注杜工部诗集
wc -l 集千家注杜工部诗集.txt → 2837行

Step 2: 读取参考文件

读取 /home/z/my-project/upload/参考/ 总结.md、日志.md、原文提取.md
→ 确认3个MD的格式规范

Step 3: 多轮grep搜索

第一轮:高价值服饰制度复合词

grep -n '衣裳\|衣冠\|衣裘\|赐绯\|绯衣\|紫衣\|金带\|玉带\|革带\|鱼袋\|幞头\|乌纱\|进贤冠\|深衣\|大带\|蔽膝\|舄\|霞帔\|翟衣\|蚕服\|戎服\|丧服\|祭服\|舆服\|冠冕\|冕旒\|衮龙\|龙衮\|章服\|朝服\|赐服\|柘黄\|貂蝉\|侍中貂\|武冠\|貂尾\|皮弁'
→ 41行命中

第二轮:衣料与裘类

grep -n '锦衣\|锦袍\|锦衾\|绮\|绢\|帛\|绫\|罗衣\|纱\|绉\|缟\|缁衣\|缁素\|素衣\|素冠\|素服\|褐衣\|布衣\|短褐\|裘马\|狐裘\|羔裘\|貂裘\|鹿裘\|羊裘\|轻裘'
→ 63行命中

第三轮:冠饰佩饰与服色

grep -n '簪\|笏\|佩\|绶\|步摇\|簪笏\|冠弁\|皮弁\|武冠\|貂\|珥\|钿\|珠玉\|珠翠\|玉佩\|金紫\|银青\|银朱\|赐紫\|赐绯\|朱衣\|紫袍\|绯袍\|青袍\|白袍\|绿袍'
→ 453行(含大量噪音)

第四轮:Python精确筛选

# 使用分级关键词+上下文模式匹配
# 一级关键词(制度性服饰词,必须提取)
# 二级关键词(描述性服饰词,选择性提取)
# 结果:205行精确命中

Step 4: 过滤噪音

主要噪音类型:

过滤原则:保留有服饰制度价值的用法,排除纯修辞用法。

Step 5: 分类整理

按10大类整理:

  1. 朝服与冠冕(冕旒、衮龙、进贤冠、侍中貂、绛帻)
  2. 赐服与品色制度(赐绯衣、金荔枝带、银章朱绂、紫泥紫诰)
  3. 官服与朝仪(衣冠朝参、皂盖、青琐)
  4. 平民与寒士服饰(布衣、裋褐、纨袴、衣百结)
  5. 妇女服饰(丽人行专节:绣罗衣裳、蹙金、翠㣲叶、珠压腰衱)
  6. 戎服与军事服饰(介胄、金甲、白袍、青袍、短衣)
  7. 裘类(翠云裘、貂鼠裘、软裘、敝裘、羔裘)
  8. 衣料与纺织(齐纨鲁缟、绮罗、绢帛、锦)
  9. 佩饰与首饰(簪笏、佩玉、银甲金鱼、金错刀)
  10. 丧服与特殊服饰(白衣、黄帽青袍)

Step 6: 保存三份文件


关键发现

  1. 《丽人行》为杜诗最完整服饰描写:绣罗衣裳、蹙金孔雀银麒麟、翠㣲叶、珠压腰衱——可补唐代贵妇服饰实物之缺
  2. 赐服制度记载具体:赐绯衣、金荔枝带、银章青绶、紫泥封诰,皆有注解佐证
  3. 品色服制层次清晰:柘黄(天子专属,僭用则反)→冕旒衮龙→朱衣→绯衣→青袍→布衣/短褐
  4. "纨袴不饿死,儒冠多误身":服饰即身份的经典对比,影响深远
  5. 千家注本身含大量服饰注解:如洙注进贤冠"古缁布冠儒者之服"、梦弼注翠㣲叶"以翠羽铺饰"等,注解价值不亚于诗句本身
  6. 裘类描写反映社会等级:翠云裘(天子)→貂鼠裘(权贵)→软裘(士人)→敝裘(贫士),层次分明

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从四库本全文grep提取,有明确行号对应。共提取服饰相关原文55条,覆盖10大类。