《逍遥集》服饰内容提取 · 工作日志
时间:2026-04-22 任务ID:batch7-2 来源:四库别集/逍遥集.txt(宋·潘阆撰)
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/逍遥集/
wc -l 逍遥集.txt → 163行(极小集)
Step 2: 参考文件研读
- 读取参考/总结.md(吕氏春秋)、参考/原文提取.md(天工开物)、参考/日志.md(晋会要)
- 确认输出格式:总结(分类+分析)、原文提取(逐条+上下文)、日志(流程+发现)
Step 3: Grep多轮搜索
第一轮:宽搜全部服饰关键词
grep -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|履|靴|袜|霞|翟|蚕"
→ 匹配行较多,但大量为颜色词(青黄白黑翠金银等)和通用字(金石、金丹等),需二次过滤
第二轮:精准匹配服饰专词
grep -n "罗衣|葛衣|草履|头冠|辞家衣|紫衣|绣衣|戎衣|珠翠|乌纱|草衣|蛾眉"
→ 精确命中10处
第三轮:补充搜索单字关键词
grep -n "步摇|笏|锦|绮|绶|裘|巾|帽|袍|衫|裙|裤|褐|衮|佩|缁|素|赤|绯|银|簪|钗|靴|霞|翟|蚕|绫|缎|纱"
→ 仅第36行(步/云霞轻中"霞")和第109行(乌纱)命中,无新增服饰条目
Step 4: 人工审读过滤
从第一轮结果中剔除噪音:
- ❌ "金石交"(第26行)——非佩饰,指交情
- ❌ "白日升天"(第69行)——非颜色,指时间
- ❌ "金丹诀"(第125行)——非金饰,指丹药
- ❌ "青松"(第113行)——非青色衣服,指植物
- ❌ "翠微""翠如堆"(第42行、第121行)——非翠色衣物,指山色
- ❌ "黄菊"(第89行)——非黄色衣物,指花卉
- ✅ 保留10处确认为服饰内容
Step 5: 分类整理
| 分类 | 条目数 | 代表 |
|---|---|---|
| 衣类 | 6 | 罗衣裳、葛衣、辞家衣、绣衣、戎衣、雾翦衣 |
| 冠帽类 | 2 | 头冠、乌纱 |
| 履鞋类 | 1 | 草履 |
| 饰品类 | 1 | 珠翠 |
| 官服类 | 1 | 紫衣/紫章 |
| 妆容类 | 1 | 蛾眉 |
| 僧服类 | 1 | 草衣 |
Step 6: 写入3个MD文件
| 文件 | 大小 | 内容 |
|---|---|---|
| 总结.md | ~6KB | 书籍概况+分类总览+重点分析+综合评述+索引 |
| 原文提取.md | ~3KB | 10处原文逐条提取+上下文 |
| 日志.md | 本文件 | 操作流程+发现+踩坑 |
关键发现
- 服饰内容极度稀少:全卷163行仅10处涉服饰,因该集为诗歌别集,非制度文献
- 赐紫制度实证:第81行自注"枢宻谏议钱公特奏紫衣"——宋代道士赐紫需经枢密院特奏,为制度史原始材料
- 文武转换服饰标记:绣衣→戎衣,反映宋初文臣转武职时服饰变化,与柳开(柳殿院)生平吻合
- 乌纱帽为隐士标配:赠林逋诗以乌纱为隐士标识,与宋代处士形象一致
- 葛衣草履=野服范式:金山寺诗中葛衣+草履组合,为宋代文人"野服"(非官服)的典型搭配
- 古意诗归属问题:罗衣裳一首实为唐崔国辅作,《永乐大典》误收,四库馆臣已注明
踩坑记录
- 颜色词噪音极大:首轮搜索匹配"青黄白黑翠金银"等颜色字,大量假阳性(青松、翠微、金丹等),必须二次过滤
- 通用字歧义:"衣"字在"辞家衣"中指衣服,但在其他语境可能仅泛指,需逐条判断
- 草衣非服饰:第116行"草衣院"为寺院名称,非直接服饰描写,但"草衣"一词本身源自僧人服饰,仍予收录
- 紫章非章服:第81行"紫章"指紫色印信凭证,非"章服"制度中的"章",需区分
审核结果
全部通过 ✅ — 原文均从逍遥集.txt中grep提取,有明确行号对应,噪音已过滤。