《祖英集》服饰内容提取日志
Task ID: batch1-4 书名:祖英集(宋·释重显) 源文件:/home/z/my-project/upload/四库别集/祖英集.txt 输出目录:/home/z/my-project/upload/四库别集output/祖英集/ 处理时间:2026-03-05
一、文件概况
- 全书行数:593行
- 文体:禅僧诗集(颂古、赠答、杂诗)
- 作者:释重显,字隐之,遂州李氏子,北宋云门宗高僧,住明州雪窦
- 四库提要定评:"胸怀脱洒,韵度自高"
二、五轮grep扫描记录
R1:核心服饰词(衣裳冠冕袍裘带佩履舄簪笄巾帻弁襦褐袂衫衮等)
- 命中行数:约25行
- 主要命中:L36弁、L54衣裓、L80弁、L94履/倾盖、L233带、L268冕、L272袍、L293方袍圆顶、L304冠、L326云袍、L333冠、L338云衣、L372带、L374带、L417紫方袍、L426屦/衣、L432朱冠、L448履、L488纱幘/袍、L508铁衣、L516带、L530带、L532袍、L536带、L552带、L560冠、L578麻衣/衲
R2:丝织品/材料词(锦绮绢帛绫罗缎丝麻葛绶绣纹缟纨纱绸等)
- 命中行数:约8行
- 主要命中:L165垂丝、L193如麻、L308紫罗/锦砂、L387丝纶、L460白头丝、L487麻居士、L488纱/苎、L578麻衣
R3:颜色/染织词(绛绯紫青朱玄黼黻白黄等)
- 命中行数:约50+行(颜色词广泛存在于自然描写)
- 服饰相关命中:L272紫袍、L308紫罗、L417紫方袍、L432朱冠、L488白苎袍
R4:制度/组合词(裳服冠服衣冠服色深衣道服鹤氅鱼袋玉带金带等)
- 命中行数:0行
- 说明:全书无服饰制度专词命中,反映诗集性质
R5:首服/足服/配饰(帽屦屐靴帔褙襕缨珰钿钗环翠珠笏等)
- 命中行数:约15行
- 主要命中:L60山帔、L180翠羽、L289璎络/花鬘、L426轻屦、L488纱幘、L494藤屦、L562轻屦
三、甄别过滤过程
3.1 "带"字过滤(最大误匹配源)
- L233"草带青青":带=动词"含带",草色含青 → 排除
- L314"月带重轮":带=动词,月亮含双轮 → 排除
- L372"雪带烟云":带=动词 → 排除
- L374"长带瀑声寒":带=动词"伴随" → 排除
- L516"弱柳依依兮带轻絮":带=动词"含" → 排除
- L530"水带岩兮流急":带=动词 → 排除
- L536"万木带秋声":带=动词 → 排除
- L552"似带微芒":带=动词 → 排除
- 保留0条:"带"在本书中无一条为衣带义
3.2 "冠"字过滤
- L304"古寺冠乎明越境":冠=动词"居首" → 排除
- L333"百越江山冠九州":冠=动词"冠绝" → 排除
- L560"圆明鉴图冠之序引":冠=动词 → 排除
- L432"朱冠首戢雪为毛":白鹇鸟冠 → 排除(非人类服饰)
- 保留1条:L268"露冕"(用典,指官员冠冕)
3.3 "弁"字过滤
- L36"弁龙蛇兮眼何正":弁=辨(辨别),"危分崄布空平间弁龙蛇"意为在险平之间辨别龙蛇 → 排除
- L80"毋厚弁之夺席":弁为人名/尊称 → 排除
3.4 其他过滤
- L94"高踪逾履/倾盖":履=行走义;倾盖=车盖之交典 → 排除
- L165"岩溜散垂丝":丝=山泉细流 → 排除
- L193"数如麻":麻=比喻众多 → 排除
- L308"紫罗帐里有真珠":紫罗帐=帷帐/室内陈设 → 排除(但记录为织物参考)
- L387"千尺丝纶":丝纶=钓线 → 排除
- L448"履道为贵":履=动词"践行" → 排除
- L460"白头丝":丝=头发 → 排除
- L487"麻居士":麻=姓氏 → 排除
- L508"铁衣随从古霜清":上下文"冷匣秋波射斗星"确认为写剑 → 排除
3.5 保留但标注的条目
- L60"山帔":帔本为服饰词,但"拥山帔"为拟人修辞 → 保留+标注
- L338"云衣":以云为衣的拟人 → 保留+标注
- L532"翠滴袍":松翠滴袍为实景+修辞交融 → 保留
四、最终统计
| 类别 | 条目数 |
|---|---|
| 僧侣服饰 | 7 |
| 赐服/官服 | 2 |
| 足服 | 3 |
| 头饰/首服 | 1 |
| 居俗混合服饰 | 1 |
| 佛教装饰 | 1 |
| 文学比喻(附注) | 3 |
| 合计 | 18 |
| 排除条目 | 15类 |
五、输出文件
| 文件 | 大小 | 内容 |
|---|---|---|
| 祖英集_原文提取.md | ~6KB | 18条原文+排除表 |
| 祖英集_总结.md | ~7KB | 分类分析+4大发现+对抗式审查+价值评估 |
| 祖英集_日志.md | 本文件 | 处理全流程记录 |
六、处理方法
- 五轮grep -n扫描(核心词→丝织品→颜色→制度词→首足配饰)
- sed -n 提取约15个关键行区段上下文(前2行后3行)
- 逐条语境确认:排除15类非服饰用法
- 撰写三份MD文档,均≤20KB
- 对抗式学术审查:过度解读/遗漏/时代归属/术语准确性四重审查
处理完成