《集千家注杜工部诗集》服饰内容提取 · 对话记录
时间:2026-04-20 任务ID: batch20-1 任务:提取《集千家注杜工部诗集》全部服饰相关内容,整理分类总结
操作流程
Step 1: 准备工作
mkdir -p /home/z/my-project/upload/四库别集output/集千家注杜工部诗集
wc -l 集千家注杜工部诗集.txt → 2837行
Step 2: 读取参考文件
读取 /home/z/my-project/upload/参考/ 总结.md、日志.md、原文提取.md
→ 确认3个MD的格式规范
Step 3: 多轮grep搜索
第一轮:高价值服饰制度复合词
grep -n '衣裳\|衣冠\|衣裘\|赐绯\|绯衣\|紫衣\|金带\|玉带\|革带\|鱼袋\|幞头\|乌纱\|进贤冠\|深衣\|大带\|蔽膝\|舄\|霞帔\|翟衣\|蚕服\|戎服\|丧服\|祭服\|舆服\|冠冕\|冕旒\|衮龙\|龙衮\|章服\|朝服\|赐服\|柘黄\|貂蝉\|侍中貂\|武冠\|貂尾\|皮弁'
→ 41行命中
第二轮:衣料与裘类
grep -n '锦衣\|锦袍\|锦衾\|绮\|绢\|帛\|绫\|罗衣\|纱\|绉\|缟\|缁衣\|缁素\|素衣\|素冠\|素服\|褐衣\|布衣\|短褐\|裘马\|狐裘\|羔裘\|貂裘\|鹿裘\|羊裘\|轻裘'
→ 63行命中
第三轮:冠饰佩饰与服色
grep -n '簪\|笏\|佩\|绶\|步摇\|簪笏\|冠弁\|皮弁\|武冠\|貂\|珥\|钿\|珠玉\|珠翠\|玉佩\|金紫\|银青\|银朱\|赐紫\|赐绯\|朱衣\|紫袍\|绯袍\|青袍\|白袍\|绿袍'
→ 453行(含大量噪音)
第四轮:Python精确筛选
# 使用分级关键词+上下文模式匹配
# 一级关键词(制度性服饰词,必须提取)
# 二级关键词(描述性服饰词,选择性提取)
# 结果:205行精确命中
Step 4: 过滤噪音
主要噪音类型:
- "衣"作动词(衣其皮革、衣金紫)
- "冠"作动词/抽象词(冠诸公、冠古才)
- "佩"作抽象词(佩服)
- "锦"作地名/比喻(锦城、锦水、锦绣)
- "帛"在"束帛"等固定用法中(保留,因涉及礼制)
- "丝"作自然物(蛛丝、雨丝)
过滤原则:保留有服饰制度价值的用法,排除纯修辞用法。
Step 5: 分类整理
按10大类整理:
- 朝服与冠冕(冕旒、衮龙、进贤冠、侍中貂、绛帻)
- 赐服与品色制度(赐绯衣、金荔枝带、银章朱绂、紫泥紫诰)
- 官服与朝仪(衣冠朝参、皂盖、青琐)
- 平民与寒士服饰(布衣、裋褐、纨袴、衣百结)
- 妇女服饰(丽人行专节:绣罗衣裳、蹙金、翠㣲叶、珠压腰衱)
- 戎服与军事服饰(介胄、金甲、白袍、青袍、短衣)
- 裘类(翠云裘、貂鼠裘、软裘、敝裘、羔裘)
- 衣料与纺织(齐纨鲁缟、绮罗、绢帛、锦)
- 佩饰与首饰(簪笏、佩玉、银甲金鱼、金错刀)
- 丧服与特殊服饰(白衣、黄帽青袍)
Step 6: 保存三份文件
- 总结.md(分类整理,约8KB)
- 原文提取.md(逐条原文+注解,约12KB)
- 日志.md(本文件)
关键发现
- 《丽人行》为杜诗最完整服饰描写:绣罗衣裳、蹙金孔雀银麒麟、翠㣲叶、珠压腰衱——可补唐代贵妇服饰实物之缺
- 赐服制度记载具体:赐绯衣、金荔枝带、银章青绶、紫泥封诰,皆有注解佐证
- 品色服制层次清晰:柘黄(天子专属,僭用则反)→冕旒衮龙→朱衣→绯衣→青袍→布衣/短褐
- "纨袴不饿死,儒冠多误身":服饰即身份的经典对比,影响深远
- 千家注本身含大量服饰注解:如洙注进贤冠"古缁布冠儒者之服"、梦弼注翠㣲叶"以翠羽铺饰"等,注解价值不亚于诗句本身
- 裘类描写反映社会等级:翠云裘(天子)→貂鼠裘(权贵)→软裘(士人)→敝裘(贫士),层次分明
关键踩坑记录
- "衣"字出现极频繁(403行),大量为非服饰用法(如"衣马"、"衣金紫"),需逐一甄别
- "冠"字在注释中常作"冠绝"、"冠军"等非服饰用法
- "锦"字半数以上为地名(锦城、锦水、锦官城),非衣料用法
- "紫"字多用于"紫禁"、"紫微"等宫殿名,非服色
- 千家注本注释极长,单行可达数千字,grep命中后需截取关键诗句部分
- 注中引《后汉志》、《汉官仪》等对服饰制度有重要补充
审核结果
全部通过 ✅ — 原文均从四库本全文grep提取,有明确行号对应。共提取服饰相关原文55条,覆盖10大类。