《道乡集》服饰内容提取 · 工作日志
时间:2026-04-19 任务ID:batch7-3 来源:四库别集·道乡集.txt(宋·邹浩撰,3297行)
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/道乡集
Step 2: 读取参考文件
- 读取 参考总结.md / 日志.md / 原文提取.md 三个模板
- 了解输出格式要求:总结(分类+分析)、日志(流程+发现)、原文提取(行号+原文)
Step 3: 多轮grep搜索
第一轮:高频基础词
衣 → 134行 | 冠 → 79行 | 裳裘袍衫裙裤褐衮 → 43行 | 绶笏佩带 → 53行
锦绮绢帛丝绸缎绫罗纱绉缟缁 → 128行
赤青黄白黑朱紫绯绿翠金银玉珠簪钗钿珥步摇 → 532行(大量噪音)
第二轮:精准复合词
冠服/舆服/章服/朝服/祭服/丧服/常服/赐服/蟒衣/飞鱼/斗牛/补服/品色/鱼袋/革带/玉带/金带/幞头/乌纱/进贤冠/深衣/大带/蔽膝/舄履靴袜/霞帔/翟衣/蚕服 → 48行
第三轮:特定宋代服饰词
幅巾 → 5行 | 布衣 → 7行 | 青衫 → 6行 | 墨绶 → 2行 | 绯衣 → 2行
金紫 → 3行 | 三品服 → 1行 | 对衣金带 → 1行 | 章服 → 2行
星冠 → 1行 | 衲衣 → 3行 | 缁素 → 1行 | 绨袍 → 1行
Step 4: 逐条审读与过滤噪音
过滤原则:
- 颜色词(赤/青/黄/白/黑/紫/翠/金/银/玉/珠)仅保留明确用于服饰语境的条目
- "衣冠"作为复合词保留,单独"衣"在非服饰语境中删除
- "带"字大量为"地带/带影"等非服饰用法,仅保留明确服饰用例
- "罗"字多为人名(罗正之等),仅保留织物语境
保留:87条有效服饰相关条目 过滤:约600+条噪音
Step 5: 分类整理
按10大类整理:
- 官服制度与赐服(11条)
- 冠帽类(14条)
- 衣裳类(34条)
- 佩饰与印绶(7条)
- 织物与材料(6条)
- 鞋履类(6条)
- 女性服饰(4条)
- 丧葬与礼制服饰(3条)
- 服饰与政治伦理(2条散见)
- 色彩与象征(融入各类)
Step 6: 写3个MD文件
- 总结.md:分类概述+核心发现+政治伦理分析
- 原文提取.md:87条原文逐条列出,附行号
- 日志.md:本文件,记录操作流程与发现
关键发现
- 《道乡集》服饰以诗歌隐喻为主:不像《晋会要》有系统的舆服志,道乡集服饰内容90%散见于诗歌,以象征性用法为主
- 幅巾+杖屦=贬谪文人标准像:邹浩本人被贬后的标志性装束
- 青衫为全册最密集服饰意象:6次出现,贯穿始终,从困顿到受恩
- 赐服序列完整:章服→对衣金带→金紫→三品服,记录了作者自身的官服晋升
- "草衣如绣裳"为全册服饰核心命题:以衣之贵贱映射人之价值判断
- 僧俗服饰交融:衲衣3次、缁素1次,体现宋代文人与佛教的密切关系
- 武将赐服实录:袍带介胄枪牌茶药的组合赐予,为宋代军事赏赐制度的珍贵记录
关键踩坑记录
- "带"字噪音极大(地带/带影/带领等),需逐条甄别
- "罗"字多为人名(罗正之、罗适等),非织物
- "素"字多为"素餐/素质/素心"等非服饰用法
- "翠"字多为"翠微/翠壁"等自然景观
- 古文中"衣冠"常作为复合词表示"士大夫阶层",非单纯服饰描写
- "箕裘"为成语"克绍箕裘"中的用法,箕为弓袋、裘为皮衣,属引申义
审核结果
全部通过 ✅ — 原文均从源文件grep提取,有明确行号对应,过滤噪音后保留87条有效服饰条目。