研究总结 日志 原文

《祖英集》服饰内容提取日志

Task ID: batch1-4 书名:祖英集(宋·释重显) 源文件:/home/z/my-project/upload/四库别集/祖英集.txt 输出目录:/home/z/my-project/upload/四库别集output/祖英集/ 处理时间:2026-03-05


一、文件概况


二、五轮grep扫描记录

R1:核心服饰词(衣裳冠冕袍裘带佩履舄簪笄巾帻弁襦褐袂衫衮等)

R2:丝织品/材料词(锦绮绢帛绫罗缎丝麻葛绶绣纹缟纨纱绸等)

R3:颜色/染织词(绛绯紫青朱玄黼黻白黄等)

R4:制度/组合词(裳服冠服衣冠服色深衣道服鹤氅鱼袋玉带金带等)

R5:首服/足服/配饰(帽屦屐靴帔褙襕缨珰钿钗环翠珠笏等)


三、甄别过滤过程

3.1 "带"字过滤(最大误匹配源)

3.2 "冠"字过滤

3.3 "弁"字过滤

3.4 其他过滤

3.5 保留但标注的条目


四、最终统计

类别 条目数
僧侣服饰 7
赐服/官服 2
足服 3
头饰/首服 1
居俗混合服饰 1
佛教装饰 1
文学比喻(附注) 3
合计 18
排除条目 15类

五、输出文件

文件 大小 内容
祖英集_原文提取.md ~6KB 18条原文+排除表
祖英集_总结.md ~7KB 分类分析+4大发现+对抗式审查+价值评估
祖英集_日志.md 本文件 处理全流程记录

六、处理方法

  1. 五轮grep -n扫描(核心词→丝织品→颜色→制度词→首足配饰)
  2. sed -n 提取约15个关键行区段上下文(前2行后3行)
  3. 逐条语境确认:排除15类非服饰用法
  4. 撰写三份MD文档,均≤20KB
  5. 对抗式学术审查:过度解读/遗漏/时代归属/术语准确性四重审查

处理完成