研究总结 日志 原文

台游日记——服饰提取日志

基本信息

提取方法

采用ripgrep逐轮关键词匹配,配合行号定位,sed提取上下文。严禁加载全文。

十轮关键词扫描记录

第1轮:衣/裳/服/冠/冕/弁/袍/裘

第2轮:巾/帽/帻/幞头/簪/缨

第3轮:帛/绢/绫/罗/绸/缎/锦/绮/丝/麻/葛/褐

第4轮:佩/笏/带/绶/鱼袋/玺/印

第5轮:履/舄/鞋/靴/袜

第6轮:舆服/服色/赐服/章服/冠服/品服/朝服/公服/祭服/丧服

第7轮:绣/纹/黼/黻/章/染/织

第8轮:裙/衫/袄/褐/帔/褙子/深衣/襕衫

第9轮:进贤冠/武冠/貂蝉/笼巾/额子

第10轮:衮/襦/裆/裈/袴/褶/裾/袂/衿/衽/领/袖/襟

对抗式审查记录

审查1:关键词命中但非服饰义者

审查2:疑似服饰条目甄别

审查3:遗漏风险

文件大小控制

处理时间