研究总结 日志 原文

六十种曲寻亲记 服饰提取日志

处理信息


提取流程

第1轮:wc -l 行数统计

第2轮:全关键词 grep -n 扫描

第3轮:逐关键词计数

关键词 命中次数 备注
13 多为动词"带领""带病",服饰义"袍带""冠带""博带"需甄别
10 "锦绣堆""锦衣归""衣锦还乡"等,多数有效
7 "罗帐里坐"为曲牌名,"纸帐"为实物
8 "布裙""布衣""荆布"等,多数有效
6 "紫绶罗栏""罗网""罗衫"等,需甄别
4 "锦绣堆""绣停针"等
3 "布裙""荆钗裙布"
3 "丝萝"为比喻
3 "絮絮叨叨"为动词
3 "天香袍染""袍带"
2 "解佩留貂"
2 多为"环顾"义
1 "轻裘"
1 "短褐"
2 "步履"
1
1 "襟怀"
1 "紫绶"
1
1 "浣纱"曲名

第4轮:噪声过滤

第5轮:sed 上下文提取


输出文件

文件 大小限制 说明
六十种曲寻亲记_服饰总结.md ≤20KB 分类总结
六十种曲寻亲记_原文提取.md ≤20KB 原文引用
六十种曲寻亲记_日志.md ≤20KB 本文件

grep 验证记录

$ rg -c '荆钗' 六十种曲寻亲记.txt → 3
$ rg -c '布裙' 六十种曲寻亲记.txt → 1
$ rg -c '鹑衣' 六十种曲寻亲记.txt → 1
$ rg -c '短褐' 六十种曲寻亲记.txt → 1
$ rg -c '锦衣归' 六十种曲寻亲记.txt → 3
$ rg -c '衣锦' 六十种曲寻亲记.txt → 2
$ rg -c '紫绶' 六十种曲寻亲记.txt → 1
$ rg -c '轻裘' 六十种曲寻亲记.txt → 1
$ rg -c '冠带' 六十种曲寻亲记.txt → 1
$ rg -c '袍带' 六十种曲寻亲记.txt → 1
$ rg -c '宽衣博带' 六十种曲寻亲记.txt → 1
$ rg -c '宫花帽' 六十种曲寻亲记.txt → 1
$ rg -c '大帽' 六十种曲寻亲记.txt → 1
$ rg -c '儒衣' 六十种曲寻亲记.txt → 1
$ rg -c '衣装' 六十种曲寻亲记.txt → 2
$ rg -c '荷衣' 六十种曲寻亲记.txt → 1

所有提取条目已通过 grep 验证确认存在于原文。