研究总结 日志 原文

传奇汇考标目 服饰提取日志

处理信息


提取流程

第1轮:wc -l 行数统计

第2轮:全关键词 grep -n 扫描

第3轮:逐关键词计数

关键词 命中次数 备注
15 剧名高频字,均有效
7 剧名含"环"
6 剧名含"佩"
5 剧名含"绣"
5 剧名含"冠",1条为人物字号
4 剧名/本事含"袍"
4 剧名含"裘"
5 剧名含"罗"
2 剧名含"绡"
4 剧名含"旗"
4 剧名含"带",需甄别
1 剧名含"绶"
3 人名1(练川)+剧名2
1
1 剧名含"纨"
1
2 剧名含"簪"
1 剧名含"裙"
1 人名"谢大绅"
2 "布衣"1条 + 其他
1 剧名"旌阳剑"
1 剧名"浣纱"

第4轮:噪声过滤

第5轮:分类整理


输出文件

文件 大小限制 说明
传奇汇考标目_服饰总结.md ≤20KB 分类总结
传奇汇考标目_原文提取.md ≤20KB 原文引用
传奇汇考标目_日志.md ≤20KB 本文件

grep 验证记录

$ rg -c '绣襦' 传奇汇考标目.txt → 1
$ rg -c '葛衣' 传奇汇考标目.txt → 1
$ rg -c '锦笺' 传奇汇考标目.txt → 1
$ rg -c '狐裘' 传奇汇考标目.txt → 1
$ rg -c '骕骦裘' 传奇汇考标目.txt → 1
$ rg -c '貂裘' 传奇汇考标目.txt → 1
$ rg -c '白练裙' 传奇汇考标目.txt → 1
$ rg -c '绨袍' 传奇汇考标目.txt → 2
$ rg -c '玉簪' 传奇汇考标目.txt → 1
$ rg -c '锦衣归' 传奇汇考标目.txt → 1
$ rg -c '布衣' 传奇汇考标目.txt → 1
$ rg -c '铁冠图' 传奇汇考标目.txt → 2
$ rg -c '锦香亭' 传奇汇考标目.txt → 1
$ rg -c '旌阳剑' 传奇汇考标目.txt → 1

所有提取条目已通过 grep 验证确认存在于原文。


特殊说明

本书为传奇剧本目录/索引性质文献,无正文叙事,服饰词均出现在剧目标题中。因此提取方式与前两部传奇(有正文服饰描写)不同:

服饰词在剧名中的分布反映了明清传奇创作中服饰意象的广泛使用,是服饰文化研究的重要目录学资料。