《窦娥冤》服饰提取日志

基本信息

处理流程

1. 行数统计

wc -l 窦娥冤.txt → 82行

文件较小,可直接全本grep。

2. 关键词grep(多轮)

3. 噪音过滤

条目 行号 过滤原因
衣食父母 L39 "衣"为比喻义,非服饰
滚绣球 L48 曲牌名,"绣"非织物
披枷带锁 L50 刑具,非服饰
随身带的有绳子 L15 "带"为动词"携带"
带牌走马 L65 "带牌"指佩带官牌
带枷上 L47 "带枷"为刑具
浣纱 L33 "浣纱"为典故(西施浣纱),非服饰描写

4. 有效服饰条目汇总

共提取有效服饰条目 14条,涉及关键词:

5. 输出文件

文件 大小
窦娥冤_服饰提取_总结.md ~4KB
窦娥冤_服饰提取_原文.md ~5KB
窦娥冤_服饰提取_日志.md ~3KB

注意事项