《礼部集》服饰内容提取 · 日志
处理时间:2026-03-05 操作者:Sub Agent (batch1-3) 源文件:/home/z/my-project/upload/四库别集/礼部集.txt(2279行)
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/礼部集/
✅ 目录创建成功
Step 2: 五轮grep扫描
R1: 基础服饰名词
grep -n '衣|裳|冠|冕|袍|裘|带|佩|履|舄|簪|笄|巾|帻|弁|襦|褐|袄|裙|裤|襕|深衣|道服|鹤氅|巾帽|鱼袋|玉带|金带|帔|褙' 礼部集.txt
命中约120行,大量重叠。核心命中:衣、裳、冠、裘、带、佩、巾、褐、裙、裘等。
R2: 织物与装饰词
grep -n '锦|绮|绢|帛|绫|罗|缎|丝|麻|葛|绶|黼|黻|绣|纹' 礼部集.txt
命中约120行。核心命中:锦、丝、绢、帛、绣等。大量"锦"为比喻用法(锦溪、锦字等)。
R3: 颜色词
grep -n '绛|绯|紫|青|朱|玄|黄|白' 礼部集.txt
命中约120行。颜色词极多但多数非服饰语境(青山、白云、黄叶等),仅保留与服饰搭配者(青衫、白袍、缁衣等)。
R4: 制度性服饰词
grep -n '裳服|冠服|衣冠|服色|衮|朝服|祭服|丧服|章服|公服|常服|品服|赐衣|袭衣' 礼部集.txt
命中约15行。核心:衣冠14见、赐衣1见、冠服1见。
R5: 补充服饰词
grep -n '袍|衫|袂|襟|袖|裾|屦|屐|靴|鞋|帽|纱|绸|缟|纨|绨|布衣|狐裘|羔裘|蓑|芒' 礼部集.txt
命中约120行。核心:袍(緼袍)、衫(青衫)、鞋(青鞋)、蓑(钓蓑、緑蓑)、纨(纨扇)等。
Step 3: 靶向grep精准提取
对高频有效词进行第二轮精准搜索:
grep -n '衣冠|布衣|缁衣|绣衣|青衫|白袍|褐衣|被褐|短衣|貂蝉|缊袍|彩衣|幅巾|青鞋|蓑|霓裳|翠袖|蚕|帛|纩|缟|裘|赐衣|缟素|衰绖' 礼部集.txt
命中约60行,为有效服饰内容的核心行号集。
Step 4: 非服饰语境过滤
| 过滤类别 | 过滤词例 | 过滤原因 |
|---|---|---|
| 地理代称 | 锦溪、锦江、青山、白云、黄叶 | 非服饰 |
| 比喻用法 | 锦绣堆(喻花)、丝棼(喻纷乱) | 非实物 |
| 人名/地名 | 葛洪(人名)、绵州(地名) | 非服饰 |
| 动词用法 | 带城(连接)、服命(遵命) | 非名词 |
| 套语 | 宵衣旰食(勤政)、垂裳而治(无为) | 非实指 |
| 文房/建筑 | 锦屏、绮窗、绣帏(多为建筑/器物) | 语境甄别 |
过滤结果:约200行原始命中 → 过滤后约58条有效服饰条目,过滤率约71%。
Step 5: 分类与撰写
将58条有效条目按9类整理:
- 衣冠/冠服(14条)
- 布衣(7条)
- 官服与品阶(11条)
- 隐逸服饰(11条)
- 女性服饰与妆饰(14条)
- 蚕桑与纺织(6条)
- 裘皮与毛织(2条)
- 丧服与礼制服饰(4条)
- 日常服饰行为(10条)
注意:部分条目跨类,总数略多于58。
Step 6: 输出文件
| 文件 | 大小 | 内容 |
|---|---|---|
| 礼部集_原文提取.md | ~7KB | 58条原文,9类分章 |
| 礼部集_总结.md | ~6KB | 5大核心发现+对抗式审查+评级 |
| 礼部集_日志.md | ~3KB | 本文件,操作全流程记录 |
关键甄别决策记录
- L669"云锦衣裳侈贝玑"——保留。"云锦衣裳"虽可能为比喻,但"侈贝玑"明确指向服饰奢华,且有《云锦》诗题,故保留。
- L537"鸡林织锦装"——保留。"织锦装"指书籍装帧,虽非人体服饰,但涉及织锦工艺,纳入"蚕桑与纺织"类。
- L409"朝衣载束"——保留。指送葬时朝衣束载,涉及丧礼服饰。
- L574"霓裳海上来"——保留。虽为灯节诗中霓裳舞意象,但反映元代民间对唐代舞服的想象传承。
- L1510"金纸丝纩杂色之徴"——保留。丝纩为赋税征收的纺织品种类,有经济史料价值。
全文完。