《野处类稿》服饰内容提取 · 操作日志
任务ID:batch11-2 时间:2026-03-04 操作者:AI古籍服饰整理助手
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/野处类稿/
wc -l 野处类稿.txt → 220行(小型诗集)
Step 2: 读取参考文件
- 读取
/home/z/my-project/upload/参考/总结.md(吕氏春秋示例) - 读取
/home/z/my-project/upload/参考/日志.md(晋会要示例) - 读取
/home/z/my-project/upload/参考/原文提取.md(天工开物示例)
Step 3: grep多轮搜索
第1轮:宽泛搜索(衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐……)
- 命中行数极多,因"衣""金""白""青"等单字在诗中高频出现
- 需进一步过滤
第2轮:复合词搜索(衣裳|裘|冠冕|帻|褐衣|锦领|紫|簪|钗|裙|蓑笠……)
- 有效命中20+行,噪音明显减少
- 关键发现:华裾锦领乌纱帻(最完整服饰描写)
第3轮:部件/材质搜索(裾|领|袖|袂|蓑|笠|屐|衲|貂|珰)
- 补充发现:倒屣迎、旧衲纹、攘袂、客袂、衲被、貂茸、袖手
- 屐痕、蜡吾屐( footwear类)
第4轮:饰品/配件搜索(貂|珰|翠|朱丝|银|珠玉|玉勒|金剪)
- 补充:金剪亲裁寄远衣、玉勒朝金闺、珠玉(令尹垂珠玉)
Step 4: 噪音过滤
过滤掉的假阳性:
| 关键词 | 诗句 | 判定 |
|---|---|---|
| 金 | "金昆石友""金闺" | 非服饰金饰,为比喻/地名 |
| 白 | "白露""素书""白社" | 非白色服饰 |
| 青 | "青子""青灯""青皇" | 非青色服饰 |
| 丝 | "丝棼""鬓欲丝" | 丝线比喻,非服饰丝织品 |
| 玉 | "玉醴""玉梅""玉水" | 非玉饰 |
| 翠 | "翠崖""翠羽乱" | 植物描写,非翠色服饰 |
| 朱 | "朱亥""朱丝" | 人名/琴弦,非朱色服饰 |
| 紫 | "紫兰""紫塞" | 植物名/地名,非紫色服饰 |
| 银 | "银灯" | 银质灯具,非银饰 |
| 绮 | "绮语" | 佛教语"绮语",非绮罗 |
| 冠 | "千古冠四科" | 冠作动词"居首",非冠帽 |
保留的服饰条目:30条(见原文提取文件)
Step 5: 分类整理
按5大类归并:
- 具体服饰物品(12条)
- 服饰动作(10条)
- 服饰典故(6条)
- 服饰材料(5条)
- 饰品/配件(4条)
部分条目跨类,按主要属性归类。
Step 6: 写入3个MD文件
- 总结.md(本文件之参照,已写)
- 日志.md(本文件)
- 原文提取.md
关键发现
- 《野处类稿》为纯诗集,无文无制度记载,服饰内容均为诗句中的意象与典故
- 最完整的服饰描写仅1处:"华裾锦领乌纱帻"——七字涵盖裾、领、帻三件
- 民间服饰描写2处:"青裙妇""蓑笠出"——罕见地记录了南宋乡村女性与农人装束
- 闺阁寄衣1处:"金剪亲裁寄远衣"——典型的闺怨诗词意象
- 僧道服饰3处:"旧衲纹""衲被""卷裓"——反映南宋禅僧生活
- 全书无一涉及服饰制度(无冕服、品色、章服等),与洪迈《容斋随笔》中的制度考辨形成反差
踩坑记录
- 单字噪音极重:诗中"衣"字出现20+次,但仅约一半为服饰义,其余为"芙蕖脱红衣"(花瓣)、"衣间蚤"(虱子栖所)等
- "冠"字双义:名词"冠帽"与动词"冠绝"并存,"千古冠四科"被误标为服饰,过滤时剔除
- "绮"字陷阱:"绮语生祸根"为佛教术语,非绮罗丝织品
- "紫""翠"等色字:诗中多作植物/地名修饰语,极少指服饰颜色
- 全书仅220行,信息密度低,30秒可通读,但严格遵循"先用grep"规则仍有必要
审核结果
全部通过 ✅
- 所有原文条目均有行号对应
- 噪音已逐条人工判定过滤
- 3个MD文件均未超过20KB限制