《金正希先生文集》服饰内容提取 · 对话记录
时间:2026-03-04 任务:提取《金正希先生文集》全部服饰相关内容,整理分类总结 任务ID:batch12-3
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/金正希先生文集
wc -l 金正希先生文集.txt → 1262行
wc -c 金正希先生文集.txt → 354,360字节
Step 2: 读取参考文件
读取3个参考MD(总结/日志/原文提取),了解输出格式规范
参考来源:《吕氏春秋》《晋会要》《天工开物》
Step 3: 多轮grep搜索
第一轮:基础服饰词(衣裳裘冠冕弁帻巾帽袍衫等)
grep -n '衣\|裳\|裘\|冠\|冕\|弁\|帻\|巾\|帽\|袍\|衫' 金正希先生文集.txt
→ 155行匹配
第二轮:织物饰品词(裙裤褐衮绶佩笏带锦绮绢帛丝等)
grep -n '裙\|裤\|褐\|衮\|绶\|佩\|笏\|带\|锦\|绮\|绢\|帛\|丝\|绸\|缎\|绫\|罗\|纱\|绉\|缟\|缁' 金正希先生文集.txt
→ 34行匹配
第三轮:颜色饰品词(素赤青黄白黑朱紫绯绿翠金银玉珠簪钗等)
grep -n '素\|赤\|青\|黄\|白\|黑\|朱\|紫\|绯\|绿\|翠\|金\|银\|玉\|珠\|簪\|钗\|钿\|珥\|步摇' 金正希先生文集.txt
→ 33行匹配
第四轮:专有名词(冠服舆服章服朝服公服祭服丧服常服戎服等)
grep -n '冠服\|舆服\|章服\|朝服\|公服\|祭服\|丧服\|常服\|戎服\|赐服\|蟒衣\|飞鱼\|斗牛\|补服\|品色\|鱼袋\|革带\|玉带\|金带\|幞头\|乌纱\|进贤冠\|深衣\|大带\|蔽膝\|舄\|履\|靴\|袜\|霞帔\|翟衣\|蚕服' 金正希先生文集.txt
→ 7行匹配
第五轮:组合精搜(冠裳/冠盖/衣裳/衣冠/被发左袵/缨冠/束带/虎冠/铜衿/襁緥/金绮/布素/衣装/衣甲等)
grep -n '冠裳\|冠盖\|衣裳\|衣冠\|被发左袵\|缨冠\|束带\|虎冠\|铜衿\|襁緥\|金绮\|布素\|衣装\|衣甲\|鬻衣\|锦腋\|青衿\|戴弁' 金正希先生文集.txt
→ 多行精准命中
Step 4: 噪音过滤
大量"衣"字出现在"衣食""求衣食"等民生语境中,属泛指而非服饰专述,已过滤。同样:
- "素"多作"素封""素守"(平素之意)→ 过滤
- "佩"多作"佩服""感佩""钦佩"→ 过滤
- "白金"为银两而非服饰 → 归入赐予类但注明
- "裘孺人"为姓氏 → 过滤
- "玉堂读书"为书斋名 → 过滤
Step 5: 分类整理
从约220行初始匹配中,筛选出18条实质性服饰内容,归为6大类:
- 冠服与官制(6条):虎冠、铜衿、冠裳、冠盖、青衿、戴弁、戴冠束带
- 戎服与军装(4条):衣装、衣甲、衣服一领、被发缨冠
- 民生服饰(3条):布素文绣、鬻衣、锦腋裘裳
- 华夷之辨(1条):被发左袵
- 朝廷赐予(1条):金绮
- 服饰隐喻(2条):缯薄、布帛
Step 6: 保存三份文件
- 总结.md(约7KB):分类总结 + 解读
- 原文提取.md(约4KB):逐条原文 + 简注
- 日志.md(本文件):操作记录 + 关键发现
关键发现
- 服饰非该书主题:《金正希先生文集》为明末政治文集,服饰内容分散零星,无系统性记载
- 最具史料价值:第825行"衣多布素,浣濯其文绣不能及吴越十分之二"——明末徽州民间服饰的珍贵实录
- 冠裳为政治隐喻:虎冠、铜衿、冠裳等主要作为官制与士风的修辞手段出现
- 戎服反映军制困境:未给衣装的士兵被送前线,衣甲全无的流寇——两极对照
- 被发左袵的再阐释:金声对管仲评价的讨论中,以"被发左袵"质疑功利与道义的关系
- 青衿折射科举不公:徽州"望一青衿若登天",反映明代边远地区科考之难
关键踩坑记录
- "衣"字出现极多(155行),但绝大多数为"衣食""求衣食"的泛指,需逐一甄别
- "素"字多为"素封""素守"之意,非服色
- "佩"字多为"感佩""佩服",非佩饰
- "白金"为白银而非白色服饰
- "裘孺人"为姓氏裘,非服饰
- "玉堂"为翰林院别称,非玉饰
审核结果
全部通过 ✅ — 原文均从grep -n搜索定位,有明确行号对应,过滤噪音后保留18条实质性服饰内容。