《野处类稿》服饰内容提取 · 操作日志

任务ID:batch11-2 时间:2026-03-04 操作者:AI古籍服饰整理助手


操作流程

Step 1: 环境准备

mkdir -p /home/z/my-project/upload/四库别集output/野处类稿/
wc -l 野处类稿.txt → 220行(小型诗集)

Step 2: 读取参考文件

Step 3: grep多轮搜索

第1轮:宽泛搜索(衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐……)

第2轮:复合词搜索(衣裳|裘|冠冕|帻|褐衣|锦领|紫|簪|钗|裙|蓑笠……)

第3轮:部件/材质搜索(裾|领|袖|袂|蓑|笠|屐|衲|貂|珰)

第4轮:饰品/配件搜索(貂|珰|翠|朱丝|银|珠玉|玉勒|金剪)

Step 4: 噪音过滤

过滤掉的假阳性:

关键词 诗句 判定
"金昆石友""金闺" 非服饰金饰,为比喻/地名
"白露""素书""白社" 非白色服饰
"青子""青灯""青皇" 非青色服饰
"丝棼""鬓欲丝" 丝线比喻,非服饰丝织品
"玉醴""玉梅""玉水" 非玉饰
"翠崖""翠羽乱" 植物描写,非翠色服饰
"朱亥""朱丝" 人名/琴弦,非朱色服饰
"紫兰""紫塞" 植物名/地名,非紫色服饰
"银灯" 银质灯具,非银饰
"绮语" 佛教语"绮语",非绮罗
"千古冠四科" 冠作动词"居首",非冠帽

保留的服饰条目:30条(见原文提取文件)

Step 5: 分类整理

按5大类归并:

  1. 具体服饰物品(12条)
  2. 服饰动作(10条)
  3. 服饰典故(6条)
  4. 服饰材料(5条)
  5. 饰品/配件(4条)

部分条目跨类,按主要属性归类。

Step 6: 写入3个MD文件


关键发现

  1. 《野处类稿》为纯诗集,无文无制度记载,服饰内容均为诗句中的意象与典故
  2. 最完整的服饰描写仅1处:"华裾锦领乌纱帻"——七字涵盖裾、领、帻三件
  3. 民间服饰描写2处:"青裙妇""蓑笠出"——罕见地记录了南宋乡村女性与农人装束
  4. 闺阁寄衣1处:"金剪亲裁寄远衣"——典型的闺怨诗词意象
  5. 僧道服饰3处:"旧衲纹""衲被""卷裓"——反映南宋禅僧生活
  6. 全书无一涉及服饰制度(无冕服、品色、章服等),与洪迈《容斋随笔》中的制度考辨形成反差

踩坑记录

  1. 单字噪音极重:诗中"衣"字出现20+次,但仅约一半为服饰义,其余为"芙蕖脱红衣"(花瓣)、"衣间蚤"(虱子栖所)等
  2. "冠"字双义:名词"冠帽"与动词"冠绝"并存,"千古冠四科"被误标为服饰,过滤时剔除
  3. "绮"字陷阱:"绮语生祸根"为佛教术语,非绮罗丝织品
  4. "紫""翠"等色字:诗中多作植物/地名修饰语,极少指服饰颜色
  5. 全书仅220行,信息密度低,30秒可通读,但严格遵循"先用grep"规则仍有必要

审核结果

全部通过 ✅