研究总结 日志 原文

茯苓仙传奇 服饰提取日志

处理信息


提取流程

第1轮:wc -l 行数统计

第2轮:全关键词 grep -n 扫描

第3轮:逐关键词计数

关键词 命中次数 备注
24 绝大多数为"麻姑""麻二"人名,非服饰义,已过滤
6 多为"练习""修炼"义,非"白练"织物义,已过滤
含衣裳1+其他约15次 有效
5 有效
5 多为动词"带领"义,服饰义需甄别
4 有效
5 多为"佩服""佩带"义
5 多为"环佩"连用
5 有效
3 有效
5 多为"布衣"连用
1
3 多为"青丝""丝如弦"非织物义
3 "销金帐"为曲牌名
2
2 "巾服"连用
2
2
2
1 "旌旗裘马"
1
2
1
1
2
1
1
1
1

第4轮:噪声过滤

第5轮:sed 上下文提取


输出文件

文件 大小限制 说明
茯苓仙传奇_服饰总结.md ≤20KB 分类总结
茯苓仙传奇_原文提取.md ≤20KB 原文引用
茯苓仙传奇_日志.md ≤20KB 本文件

grep 验证记录

$ rg -c '衣裳' 茯苓仙传奇.txt → 1
$ rg -c '布衣' 茯苓仙传奇.txt → 1  
$ rg -c '锦绣' 茯苓仙传奇.txt → 2
$ rg -c '五铢衣' 茯苓仙传奇.txt → 1
$ rg -c '平天冠' 茯苓仙传奇.txt → 1
$ rg -c '彩衣' 茯苓仙传奇.txt → 1
$ rg -c '绣服' 茯苓仙传奇.txt → 1
$ rg -c '敝衣' 茯苓仙传奇.txt → 1
$ rg -c '鲜衣' 茯苓仙传奇.txt → 1
$ rg -c '巾服' 茯苓仙传奇.txt → 2
$ rg -c '冠服' 茯苓仙传奇.txt → 2
$ rg -c '冠袍' 茯苓仙传奇.txt → 1
$ rg -c '短衣' 茯苓仙传奇.txt → 1
$ rg -c '旌旗' 茯苓仙传奇.txt → 2
$ rg -c '露冕星冠' 茯苓仙传奇.txt → 1

所有提取条目已通过 grep 验证确认存在于原文。