《长兴集》服饰内容提取 · 工作日志
时间:2026-03-04 任务ID:batch14-4 任务:提取《长兴集》服饰内容,产出3个MD
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/长兴集
源文件: /home/z/my-project/upload/四库别集/长兴集.txt
文件大小: 495行, 172,992字节 (~169KB)
Step 2: 读取参考文件
参考文件3个: 总结.md / 日志.md / 原文提取.md
参考格式: 《吕氏春秋》《晋会要》《天工开物》
确认输出格式: 总结(分类归纳) + 原文提取(逐条引文+注释) + 日志(操作记录)
Step 3: grep多轮搜索(5轮)
第1轮:基础服饰词
pattern: 衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐
结果: 52行命中
第2轮:丝织品与佩饰
pattern: 衮|绶|佩|笏|带|锦|绮|绢|帛|丝绸|缎|绫|罗|纱|绉|缟|缁
结果: 38行命中
第3轮:颜色与饰品
pattern: 素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥
结果: 大量命中(颜色词噪音高)
第4轮:复合服饰词
pattern: 冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带
结果: 7行命中(精准)
关键: 赐紫金鱼袋(第22行) / 赐绯鱼袋(第403行) / 戎服(第73行) / 赐紫金鱼袋(第433行)
第5轮:冠服具名
pattern: 幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服|步摇
结果: 仅"袜"1行命中(罗韈,第258行)
Step 4: sed上下文提取
sed -n '20,30p' → 赐对衣鞍辔马表
sed -n '42,50p' → 延州到任表(缓帯轻裘) + 谢赐衣袄表
sed -n '70,85p' → 贺捷表(衣冠) + 谢赐戎服表 + 谢赐夏药表(冕旒) + 谢赐对衣表
sed -n '99,109p' → 进守令图(黄绫/紫绫/缣素/赐绢)
sed -n '330,345p' → 墓志铭(衣裘簮珥/緌冠/襁)
sed -n '425,435p' → 墓志铭(衣食空壁/帷裳衾襚/盛服/珠玉)
sed -n '450,460p' → 墓志铭(赐绯衣银鱼袋/赐三品服)
sed -n '485,495p' → 布缕之征(布帛赋税)
Step 5: 过滤噪音
- 颜色词(素/赤/青/黄/白/黑等)命中极多,大量为风景描写、人名地名
- 过滤规则:仅保留与服饰直接相关(服色、衣料颜色、饰品材质)
- "金"字:金腰带/金鱼袋保留,金銮/金城/金帛等非服饰用途过滤
- "玉"字:玉山县君(地名)过滤,珠玉之饰(饰品)保留
Step 6: 分类整理
分6大类:
- 赐服制度(4篇谢表)
- 品服章饰(鱼袋、服色)
- 礼制服饰(丧葬、冠冕、簪屦)
- 丝织材料(绫、锦、绢、帛)
- 裘皮服饰(轻裘、旃裘)
- 服饰观念(衣冠文明、布褐平民)
Step 7: 写3个MD文件
- 总结.md:分类归纳,含表格,≤20KB ✓
- 原文提取.md:逐条引文+注释,≤20KB ✓
- 日志.md:本文件,≤20KB ✓
关键发现
- 四篇赐服表启是全书最系统的服饰材料:衣一袭/衣袄/戎服/对衣,各有不同规格
- 戎服赐品最详:紫丝银线花袄+红锦勒帛+弓刀枪旗,全套武备,为北宋边帅赐服实录
- 品服章饰序列清晰:紫金鱼袋(三品以上) > 绯衣银鱼袋(五品) > 赐三品服(借紫)
- 六处鱼袋记载,印证北宋品官章服等级制度
- 缣素/黄绫/紫绫为地图装裱用丝,反映宋代丝织品多用途
- 布帛赋税(第491行)为国家财政视角下的纺织记录
- 衣冠文明意象(第72行)为收复故土后汉服重现的生动记录
踩坑记录
- 文本为四库馆臣转录,常见异体/避讳:带→帯、签→籤、裳→常(部分)
- 部分文字OCR讹误:绵襴中为不可识字;紫丝防中"防"疑为"线"
- "绯衣"与"绯鱼袋"需区分:绯衣=绯色公服,绯鱼袋=绯色+银鱼袋
- 颜色词噪音极高,需逐条人工判别是否与服饰相关
- 第491行"布泉也"为货币术语,非服饰,但"布帛也"为纺织品