研究总结 日志 原文

《礼部集》服饰内容提取 · 日志

处理时间:2026-03-05 操作者:Sub Agent (batch1-3) 源文件:/home/z/my-project/upload/四库别集/礼部集.txt(2279行)


Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/礼部集/

✅ 目录创建成功


Step 2: 五轮grep扫描

R1: 基础服饰名词

grep -n '衣|裳|冠|冕|袍|裘|带|佩|履|舄|簪|笄|巾|帻|弁|襦|褐|袄|裙|裤|襕|深衣|道服|鹤氅|巾帽|鱼袋|玉带|金带|帔|褙' 礼部集.txt

命中约120行,大量重叠。核心命中:衣、裳、冠、裘、带、佩、巾、褐、裙、裘等。

R2: 织物与装饰词

grep -n '锦|绮|绢|帛|绫|罗|缎|丝|麻|葛|绶|黼|黻|绣|纹' 礼部集.txt

命中约120行。核心命中:锦、丝、绢、帛、绣等。大量"锦"为比喻用法(锦溪、锦字等)。

R3: 颜色词

grep -n '绛|绯|紫|青|朱|玄|黄|白' 礼部集.txt

命中约120行。颜色词极多但多数非服饰语境(青山、白云、黄叶等),仅保留与服饰搭配者(青衫、白袍、缁衣等)。

R4: 制度性服饰词

grep -n '裳服|冠服|衣冠|服色|衮|朝服|祭服|丧服|章服|公服|常服|品服|赐衣|袭衣' 礼部集.txt

命中约15行。核心:衣冠14见、赐衣1见、冠服1见。

R5: 补充服饰词

grep -n '袍|衫|袂|襟|袖|裾|屦|屐|靴|鞋|帽|纱|绸|缟|纨|绨|布衣|狐裘|羔裘|蓑|芒' 礼部集.txt

命中约120行。核心:袍(緼袍)、衫(青衫)、鞋(青鞋)、蓑(钓蓑、緑蓑)、纨(纨扇)等。


Step 3: 靶向grep精准提取

对高频有效词进行第二轮精准搜索:

grep -n '衣冠|布衣|缁衣|绣衣|青衫|白袍|褐衣|被褐|短衣|貂蝉|缊袍|彩衣|幅巾|青鞋|蓑|霓裳|翠袖|蚕|帛|纩|缟|裘|赐衣|缟素|衰绖' 礼部集.txt

命中约60行,为有效服饰内容的核心行号集。


Step 4: 非服饰语境过滤

过滤类别 过滤词例 过滤原因
地理代称 锦溪、锦江、青山、白云、黄叶 非服饰
比喻用法 锦绣堆(喻花)、丝棼(喻纷乱) 非实物
人名/地名 葛洪(人名)、绵州(地名) 非服饰
动词用法 带城(连接)、服命(遵命) 非名词
套语 宵衣旰食(勤政)、垂裳而治(无为) 非实指
文房/建筑 锦屏、绮窗、绣帏(多为建筑/器物) 语境甄别

过滤结果:约200行原始命中 → 过滤后约58条有效服饰条目,过滤率约71%。


Step 5: 分类与撰写

将58条有效条目按9类整理:

  1. 衣冠/冠服(14条)
  2. 布衣(7条)
  3. 官服与品阶(11条)
  4. 隐逸服饰(11条)
  5. 女性服饰与妆饰(14条)
  6. 蚕桑与纺织(6条)
  7. 裘皮与毛织(2条)
  8. 丧服与礼制服饰(4条)
  9. 日常服饰行为(10条)

注意:部分条目跨类,总数略多于58。


Step 6: 输出文件

文件 大小 内容
礼部集_原文提取.md ~7KB 58条原文,9类分章
礼部集_总结.md ~6KB 5大核心发现+对抗式审查+评级
礼部集_日志.md ~3KB 本文件,操作全流程记录

关键甄别决策记录

  1. L669"云锦衣裳侈贝玑"——保留。"云锦衣裳"虽可能为比喻,但"侈贝玑"明确指向服饰奢华,且有《云锦》诗题,故保留。
  2. L537"鸡林织锦装"——保留。"织锦装"指书籍装帧,虽非人体服饰,但涉及织锦工艺,纳入"蚕桑与纺织"类。
  3. L409"朝衣载束"——保留。指送葬时朝衣束载,涉及丧礼服饰。
  4. L574"霓裳海上来"——保留。虽为灯节诗中霓裳舞意象,但反映元代民间对唐代舞服的想象传承。
  5. L1510"金纸丝纩杂色之徴"——保留。丝纩为赋税征收的纺织品种类,有经济史料价值。

全文完。