研究总结 日志 原文

《交谊典傲慢部》服饰提取日志

一、操作流程记录

步骤 操作 结果
1 wc -c 查文件大小 29,968字节
2 创建输出目录 /home/z/my-project/upload/p1output/交谊典傲慢部/
3 第一轮grep:衣裳冠冕巾帽袍衫裙裘带佩履舄靴 命中:衣15、冠6、履4、巾1、带2、帽1、袍1、裙1、衫1、靴1
4 第二轮grep:服色舆服冠服章服朝服祭服丧服吉服常服公服 命中:冠服1、戎服2
5 第三轮grep:丝帛绢锦绮绫罗缎绸缂丝葛麻布褐 命中:锦1、纻1;排除误命中(葛=诸葛亮, 罗=姓氏)
6 第四轮grep:紫袍绯袍绿袍赐紫赐绯鱼袋笏幞头金带玉带 无命中
7 第五轮grep:旂旗章珮环玦簪钗钿翠珠玉 命中:钗1、环1;排除误命中(环=环卫官)
8 Python精确提取上下文 提取48处原始命中
9 对抗式审查 排除6处误命中,确认25条有效记录
10 分类整理 A服制5/B日常11/C动作6/D配饰3
11 生成三篇MD 完成

二、关键词命中统计

五轮关键词命中明细

第一轮(基础服饰词)

关键词 原始命中 有效命中 排除原因
15 12 "衣冠"合算1处、"布衣"合算1处
6 3 "弱冠"3处=成年礼,非帽子
4 2 "非礼勿履""必履泰山之安"=踩踏
1 1
2 1 "带二江"=带领
1 1
1 1
1 1
1 1
1 1
0 0
0 0
0 0
0 0
0 0

第二轮(制度服饰词)

关键词 原始命中 有效命中 排除原因
冠服 1 1
戎服 2 2
服色/舆服/章服/朝服/祭服/丧服/吉服/常服/公服 0 0

第三轮(织物材料词)

关键词 原始命中 有效命中 排除原因
1 1 宫锦袍
1 1 红纻窄衫
2 0 均为"诸葛亮"姓名
2 0 均为"罗给事隐"姓氏

第四轮(品级服饰词)

关键词 原始命中 有效命中
全部 0 0

第五轮(配饰词)

关键词 原始命中 有效命中 排除原因
1 1 荆钗
1 0 "环卫官"非配饰

补充识别关键词(非词库内但实际命中)

关键词 命中数 说明
1 岸帻(推头巾)
1 高屐(高底木屐)
1 素氅衣(大氅)
1 解绶(官印丝带)
车服 1 舆服制度术语

三、误命中排除清单

序号 关键词 原文片段 排除理由
1 "非礼勿履" 履=踩踏,非鞋
2 "必履泰山之安" 履=踩踏,非鞋
3 "带二江之双流" 带=带领,非腰带
4 "环卫官" 环=环卫,非佩饰
5 "罗给事隐" 罗=姓氏,非织物
6 "诸葛亮" 葛=姓名用字,非织物

四、文件结构

服饰内容集中于纪事杂录两部分。

五、质量声明