《谢文庄公集》服饰内容提取 · 工作日志
时间:2026-03-05 任务ID:batch2-4 操作者:古籍服饰整理专家(AI Agent)
操作流程
Step 1: 创建输出目录
mkdir -p "/home/z/my-project/upload/四库别集output/谢文庄公集/"
✅ 目录创建成功
Step 2: 读取参考模板
读取 /home/z/my-project/upload/参考/ 下三个模板文件:
- 总结.md:服饰结构化综述格式(含分类、引用、按语、总结表、对抗式审查)
- 日志.md:操作流程记录格式
- 原文提取.md:带行号的原始匹配片段格式
Step 3: 检查源文件基本信息
wc -l 谢文庄公集.txt
# 结果:623行
Step 4: 第一轮grep搜索——基本服饰词
关键词:衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐
匹配行数:59行
Step 5: 第二轮grep搜索——织物与佩饰词
关键词:衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁
匹配行数:43行
Step 6: 第三轮grep搜索——颜色与珠宝词
关键词:素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗
匹配行数:201行(大量噪音,颜色词在诗文中出现频率极高)
Step 7: 第四轮grep搜索——服饰专词
关键词:冠服|舆服|章服|朝服|公服|祭服|丧服|常服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|犀带|角带|幞头|乌纱|进贤冠|貂蝉|獬豸|通天冠|远游冠|皮弁|韦弁|燕服|深衣|大带|鞶带|蔽膝|舄|履|靴|袜|亵衣|中衣|衫裙|袄|褙子|半臂|披帛|霞帔|命妇|翟衣|褕翟|阙翟|鞠衣|礼衣|蚕服
匹配行数:2行(极少,仅"章服""冠带"命中有实质内容)
Step 8: 第五轮grep搜索——组合服饰词
关键词:银带|朝服|冠履|象简|豸冠|铁面|绣衣|龙衮|紫袍|金带|玉带|葛巾|斑衣|锦衣|宫袍|银带|冠带|衣锦|衣冠
匹配行数:约20行,含金量高
Step 9: 阅读全部匹配行原文
逐一阅读所有匹配行的完整内容,筛选过滤噪音:
- 排除纯修辞用法的颜色词(如"青山""白云""黄金瓯"等非服饰语境)
- 保留真正涉及服饰制度、冠服描写、赐服赏赉的内容
- 保留服饰文化象征(衣冠、簪缨等),但标注其修辞性质
Step 10: 分类整理
将筛选后的服饰内容分为8大类:
- 明代官员冠服制度(状元赐服、御史冠服、监察官服)
- 朝廷赐服与赏赉制度(经筵赐服、使臣赐服、升官赐带)
- 官员日常服饰与礼仪(朝仪服饰、赴任服饰)
- 服饰的文化象征(衣冠望族、簪缨世泽、衣锦还乡)
- 其他服饰记述(沾巾、湿衣裳、羊裘、鹤冠等)
- 历史服饰制度引述(唐定章服、宋详服制)
Step 11: 撰写3个MD文件
- 谢文庄公集_总结.md:结构化综述
- 谢文庄公集_日志.md:本文件
- 谢文庄公集_原文提取.md:带行号的原始片段
关键发现
- 监察系统冠服最详:朱衣象简、铁面豸冠、绣衣骢马、豸衣、豸冠——文集对明代御史按察使系统的冠服记述最为完整
- 状元赐服实证:"银带朝服冠履"为明代状元及第赐服的原始记载
- 出使服饰珍贵:麒麟服、宫锦、文锦等赐予使臣的服饰记载,为明代外交服饰制度的实证
- 百官朝仪纪实:"乌纱黑带百官同"为明代祭祀时百官统一服饰的珍贵实录
- 高官赴任全貌:紫袍金带 + 皂葇朱旛,完整呈现明代府尹赴任的冠服与仪仗
- 民俗遗存:留靴悬门为古代"脱靴遗爱"民俗的实证
关键踩坑记录
- 颜色词(素/赤/青/黄/白/黑/朱/紫/绿/翠/金/银/玉)匹配201行,噪音率约90%,大量为诗文中的景物描写(如"青山""白云""黄金瓯"),需逐一甄别
- "锦衣"在文中出现4次,其中2次指"锦衣卫"(官署名),非服饰描写,已排除
- "带"字出现频繁,但多数为"地带""带月""带着"等非服饰用法,仅"银带""黑带""金带""腰带横金""黄金带"为服饰
- "丝"字出现处多为"丝弦""蛛丝"等,仅"紸丝贰表里"为服饰用料
- "章服"出现1次,在廷对策中引述唐代制度,非明代当朝制度描写
- "衣冠"出现约10次,多为士大夫代称("衣冠望族""衣冠骈集"),非具体服饰描述
审核结果
全部通过 ✅ — 原文均从谢文庄公集.txt中grep提取,有明确行号对应。噪音已过滤,仅保留与服饰制度、冠服描写、赐服赏赉直接相关的条目。