《端明集》服饰内容提取 · 工作日志
时间:2026-04-18 任务:提取《端明集》全部服饰相关内容,整理分类总结
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/端明集/
Step 2: 检查源文件
wc -l /home/z/my-project/upload/四库别集/端明集.txt
→ 2766行
Step 3: grep搜索服饰关键词
grep -n '衣裳|冠服|衣冠|裳服|服色|衮|冕|袍|裘|佩|簪|弁|帻|褐|绶|黼|黻|深衣|道服|鹤氅|鱼袋|玉带|金带|巾帽|帔|褙|袄|裙|裤|襕|绛纱|绯|朝衣|赐衣|紫袍|金紫|章服|冠带|组绶|印绶|衣带|衣锦' 端明集.txt
→ 77行匹配
Step 4: 精细化搜索
分两轮搜索:
- 第一轮:宽泛关键词(衣、裳、冠、裘等单字+双字词组),匹配约200行
- 第二轮:精准复合词(衣裳、冠服、金紫、章服、象服、赐绯、赐紫等),匹配77行
Step 5: sed提取关键行上下文
逐一提取77行中与服饰直接相关的段落,使用 sed -n 'Xp' 和 sed -n 'X,Yp' 提取上下文。
排除以下类型:
- 单纯颜色词(青、白、紫等)用于描写山水的
- "佩"用于"佩道""佩服"等非服饰义的
- "丝"用于描写自然景物的
- "纹"用于砚台纹理的
最终确认有效服饰相关段落约35处。
Step 6: 分类整理
按主题分为七大类:
- 官服与品级(12条)
- 朝服与礼制(4条)
- 服饰制度论议(5条)
- 赐衣与军事(1条)
- 命妇服饰(2条)
- 日常与诗中服饰(12条)
- 纺织物与经济(3条)
Step 7: 保存三份文件
- 端明集_原文提取.md(约8KB)
- 端明集_总结.md(约6KB)
- 端明集_日志.md(本文件)
关键发现
- 《端明集》服饰内容以官服品级为核心:蔡襄长期担任知制诰,撰写的制诰、墓志铭中大量涉及赐服、章服、鱼袋等内容
- 蔡襄的政治服饰观:主张"车服有序",反对"赐章服"作为利诱,体现其直谏风格
- 象服/公衮/冠帔的频繁出现:反映宋代命妇服饰制度的实际运作,蔡襄母获赐冠帔更是"前无比例"
- 服饰与地方风俗:仙游"不儒衣冠不得与良子弟齿"为宋代地方社会史珍贵史料
- 纺织经济史料:绵绮配售、输绢等记载反映宋代赋税与丝织品经济的矛盾
关键踩坑记录
- 单字关键词(衣、冠、佩、丝、白、青、紫等)误匹配率极高,需逐条筛选
- "衣冠"在诗中多用作"士大夫"的代称,非直接描写服饰
- "裘"出现在"朝寒上裘"中为日常穿用,非制度性记载
- "绫纹"出现在咏砚诗中,描写砚台纹理而非纺织品
- "赐紫"出现在官场语境中,需区分是实指紫服还是官称(如"赐紫金鱼袋")
- 四库本为繁体无标点,提取时需自行断句
审核结果
全部通过 ✅ — 原文均从四库本端明集.txt中grep提取,有明确行号对应。排除非服饰义的颜色词、器物描写等误匹配项。