《野处集》服饰内容提取 · 操作日志
任务ID: batch11-3 时间:2026-03-05 操作者:AI古籍服饰整理专家 输入:/home/z/my-project/upload/四库别集/野处集.txt(441行) 输出:/home/z/my-project/upload/四库别集output/野处集/
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/野处集
wc -l 野处集.txt → 441行
Step 2: 读取参考文件
- 参考/总结.md → 《吕氏春秋》服饰汇编(分类模板)
- 参考/日志.md → 《晋会要》提取日志(流程模板)
- 参考/原文提取.md → 《天工开物》原文提取(格式模板)
Step 3: Grep多轮搜索
第1轮:基本服饰词
rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|履|靴|袜' 野处集.txt
→ 命中200行(含大量噪音,如地名、人名中的颜色字)
第2轮:特定制度词
rg -n '衮|绶|笏|幞|乌纱|进贤|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服|蟒|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带' 野处集.txt
→ 命中行:200(搢笏)、234(象笏)、390(鳬舄)
第3轮:制度性服饰词
rg -n '冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服' 野处集.txt
→ 命中行:194(尚冠服)
第4轮:基本衣冠词
rg -n '衣|裘|袍|衫|褐|裳' 野处集.txt
→ 命中行:26, 48, 74, 98, 108, 112, 158, 170, 234, 378, 422
第5轮:冠巾帽及丝织品
rg -n '冠|巾|帽|弁|帻|簪|钗|珥|步摇|带|佩|绶|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁' 野处集.txt
→ 命中行:36, 38, 44, 72, 74, 108, 112, 116, 138, 158, 170, 194, 212, 280, 316, 324, 328, 334, 394, 414, 418
Step 4: 噪音过滤
过滤原则:
- 地名含颜色字(如"赤城""青松")→ 排除
- 人名含服饰字(如"朱飞卿")→ 排除
- 泛用词("玉成""金碧""白衣"非指服饰)→ 逐条判断
- "衣食"并提、非专门服饰论述 → 保留但降级
有效服饰条目(15条):
| 行号 | 关键词 | 类型 | 信度 |
|---|---|---|---|
| 34 | 华颠野服 | 隐逸服饰 | ★★★ |
| 44 | 黄冠师 | 道教服饰 | ★★★ |
| 48 | 盛服事帝 | 道教服饰 | ★★★ |
| 132 | 金縁紫服 | 道教赐服 | ★★★ |
| 170 | 幅巾野褐 | 隐逸服饰 | ★★★ |
| 194 | 尚冠服/免冠 | 官服制度 | ★★★ |
| 200 | 搢笏/赐四品服 | 官服制度 | ★★★ |
| 212 | 服心丧 | 丧服礼制 | ★★☆ |
| 234 | 朱衣象笏 | 赐服制度 | ★★★ |
| 316 | 博带峩冠 | 儒士服饰 | ★★★ |
| 328 | 簮裾 | 儒士服饰 | ★★☆ |
| 378 | 六铢衣/白衣/璎珞 | 佛教服饰 | ★★★ |
| 390 | 鳬舄 | 服饰典故 | ★★☆ |
| 418 | 缁门 | 佛教服饰 | ★★☆ |
| 422 | 同袍 | 服饰典故 | ★★☆ |
Step 5: 分类
按7大类整理:官服制度、隐逸服饰、道教服饰、佛教服饰、儒士服饰、丧服礼制、服饰典故
Step 6: 写3个MD文件
- 总结.md ← 分类总结(本文档的同级)
- 日志.md ← 本文件
- 原文提取.md ← 原文行号+上下文
关键发现
- 《野处集》服饰内容稀疏:全书441行,直接服饰描写仅约15处,无系统性服饰制度论述
- 最核心发现:元朝"尚冠服"制度 — 汪从善入舒库尔齐班"尚冠服",为元朝近侍冠服制度的罕见实录
- 赐服双重体系:世俗"朱衣象笏"与道教"金縁紫服"并行,体现元代多轨赐服
- 宋遗民服饰:"华颠野服""幅巾野褐"为元初遗民服饰的生动记录
- 服饰词汇高度隐喻化:衣冠、弹冠、箕裘、菟裘、同袍等已脱离实物意义
踩坑记录
- 全书"金""玉""青""白"等字大量出现于地名、人名、景物描写中,噪音极多
- "服"字出现频率极高,但多数为"服官政""服阕""服心丧""衣服"等,非服饰制度
- "丝""帛""锦"等丝织品词几乎无实物描写,仅"锦树屏"为比喻用法
- "鳬舄"(390行)为典故引用(王乔双凫),非实际服饰记录
- "同袍"(422行)为战友之意,已非服饰原义
审核结果
全部通过 ✅ — 原文均从grep+sed提取,有明确行号对应,噪音已逐条过滤标注。