《金文靖集》服饰内容提取 · 对话记录
时间:2026-03-05 任务ID: batch12-2 任务:提取《金文靖集》全部服饰相关内容,整理分类总结
操作流程
Step 1: 准备工作
mkdir -p /home/z/my-project/upload/四库别集output/金文靖集
wc -l 金文靖集.txt → 1975行
读取参考文件3份(总结/日志/原文提取),确认输出格式。
Step 2: 第一轮grep——高频关键词
grep -n '衣\|裳\|裘\|冠\|冕\|弁\|帻\|巾\|帽\|袍\|衫\|裙\|裤\|褐' 金文靖集.txt
# 结果:250行
grep -n '衮\|绶\|佩\|笏\|带\|锦\|绮\|绢\|帛\|丝\|绸\|缎\|绫\|罗\|纱\|绉\|缟\|缁' 金文靖集.txt
# 结果:197行
grep -n '素\|赤\|青\|黄\|白\|黑\|朱\|紫\|绯\|绿\|翠\|金\|银\|玉\|珠\|簪\|钗\|钿\|珥' 金文靖集.txt
# 结果:668行(大量颜色词噪音)
grep -n '步摇\|冠服\|舆服\|章服\|朝服\|公服\|祭服\|丧服\|常服\|戎服\|赐服\|蟒衣\|飞鱼\|斗牛\|补服\|品色\|鱼袋\|革带\|玉带\|金带\|幞头\|乌纱\|进贤冠\|深衣\|大带\|蔽膝\|舄\|履\|靴\|袜\|霞帔\|翟衣\|蚕服' 金文靖集.txt
# 结果:52行
Step 3: 第二轮grep——精确制度词
grep -n '衣冠\|衣裳\|赐衣\|朝衣\|法服\|朝服\|祭服\|丧服\|赐服\|深衣\|翟衣\|蚕服' 金文靖集.txt
# 结果:大量衣冠(40+次),其余极少
grep -n '衮冕\|衮服\|皮弁\|进贤冠\|幞头\|乌纱\|鱼袋\|革带\|玉带\|金带\|银带\|大带\|蔽膝\|步摇\|品色\|笏\|绶' 金文靖集.txt
# 结果:约10行有效
grep -n '冠\|冕\|弁\|帻\|巾\|帽\|袍\|衫\|裙\|裘' 金文靖集.txt
# 结果:318行(大量噪音)
Step 4: 第三轮grep——制度性复合词
grep -n '衮衣\|衮服\|龙衮\|貂蝉\|绣衣\|金带\|玉带\|锦衣\|锦袍\|赐衣\|紫绶\|绯袍\|墨绶\|银青\|笏\|幅巾\|褐衣\|布衣\|簮笏\|佩珂\|赐服' 金文靖集.txt
# 结果:核心服饰条目约30余条
grep -n '紫绮\|文茵\|锦绣\|罗绮\|缣素\|绮纨\|绢\|帛\|丝绸\|缎\|绫罗\|纱罗\|缟\|缁' 金文靖集.txt
# 结果:织物词约20余条
Step 5: 过滤噪音与分类
- 排除:颜色词作非服饰用者(如"白云""青山"等风景描写)、"衣冠"仅作身份代称无服饰实质者
- 保留:有服饰制度、衣料材质、服饰场景描写者
- 分类:7大类(朝服官服/衣冠文化/隐逸服饰/织物衣料/冠服仪注/佩饰/特殊场景)
Step 6: 写3份文件
- 总结.md(本文件):分类总结与核心发现
- 原文提取.md:按类摘录原文,附行号
- 日志.md:操作记录(本文件)
关键发现
- 《金文靖集》服饰以朝仪颂圣为主调:作者金幼孜为永乐翰林侍臣,集中大量颂赋(北京赋、麒麟赋、白象赋等),服饰描写多服务于铺陈朝会盛况
- "衣冠"使用极频:40余次,兼具(1)官员阶层(2)文化世族(3)国家文明三重含义,是明代文人集中最典型的服饰相关词
- 深衣大带为唯一具体的儒者服饰制度描写(L1378),出现在赠序中描写周仲源燕居生活
- 服色制度精准:紫绶/绯袍/墨绶的品官等级(L832, L905)符合明代制度
- 幅巾褐衣/布衣韦带为隐逸服饰的标准组合,出现在多篇赠序墓志中
- 缟多作写景喻物(梅花白鸟雪景),非实指服饰,需注意过滤
踩坑记录
- "衣冠"40+次中,仅约5-6次有服饰制度实质内容,多数为身份代称,需仔细甄别
- 颜色词(素赤青黄白黑朱紫等)668条,绝大部分为风景描写或非服饰用,不可直接计入
- 单字"衣""冠"匹配行太多(250+318行),必须用复合词精确搜索
- "缁磷"(L27)非服饰用,为《论语》典故"磨而不磷,涅而不缁"
- "锦绣"多作形容词(如"锦绣中"),非实指锦和绣两种织物