研究总结 日志 原文

《声律发蒙》服饰关键词检索日志


Step 1:冠服类关键词检索

命令rg -n "冠|冕|弁|帻|巾|帽|幞头" 声律发蒙.txt

结果

踩坑:"冠"出现3次,1次为动词(冠世)。"冕、弁、帻、帽、幞头"全书无命中。"巾"1条有效。


Step 2:衣裳类关键词检索

命令rg -n "衣|裳|袍|衫|袄|褐|裘|襦|裙|褂|深衣|朝服|祭服|衮服|章服" 声律发蒙.txt

结果(去重后9条有效):

踩坑:"衣"字出现较多但多为衣冠/衣裳组合词,辨识度高。"裳、袄、褐、裘、襦、裙、褂、深衣、朝服、祭服、衮服、章服"均无命中。


Step 3:佩饰类关键词检索

命令rg -n "佩|绶|笏|带|玉带|金带|犀带|环|珮" 声律发蒙.txt

结果

踩坑:"带"字4次出现,3次为腰带义1次为动词。"佩、绶、笏、玉带、金带、犀带、珮"全书无命中。"环"命中但为动词(L215"攻已环"=环绕),非佩饰。


Step 4:靴履类关键词检索

命令rg -n "履|舄|靴|鞋|袜" 声律发蒙.txt

结果

踩坑:"履"仅1次命中且为有效。"舄、鞋、袜"全书无命中。靴履类词汇稀缺。


Step 5:材质类关键词检索

命令rg -n "丝|帛|绢|绫|罗|绸|缎|锦|绮|纱|麻|葛|布|棉" 声律发蒙.txt

结果(大量命中,逐一甄别):

踩坑:材质类关键词命中极多(约20+条),噪音率约50%。"锦"字尤其高频,需严格区分实物用法与比喻用法。"绢、绸、缎、葛、布、棉"全书无命中。


Step 6:染色类关键词检索

命令rg -n "染|青|赤|黄|白|黑|玄|紫|绯|绿|朱" 声律发蒙.txt

结果(极多命中,仅列有效条目):

排除主要噪音:青(青山/青天/青春/青楼等约10次)、白(白日/白首/白面等约8次)、黄(黄花/黄童/黄牛等约6次)、紫(紫陌/紫燕/紫塞等4次均为非服色义)、绿(绿杨/绿草等约6次均为自然色)、赤(赤壁地名1次)。

踩坑:染色类噪音率极高(约90%),尤其"青""白""黄"在声律启蒙中大量用于自然景色描写。"染"仅L100出现1次"山染翠"为自然景色非染色工艺。


Step 7:制度类关键词检索

命令rg -n "服色|舆服|冠服|章服|赐服|品色|丧服" 声律发蒙.txt

结果:零命中。


Step 8:动作词关键词检索

命令rg -n "赐|着|服|冠|佩|戴" 声律发蒙.txt

结果

踩坑:"赐"全书无命中(声律启蒙不涉及赐服制度)。"佩"无命中。


审核结论

类别 grep命中数 有效条目数 噪音率
冠服类 4 3 25%
衣裳类 12 9 25%
佩饰类 5 4 20%
靴履类 2 2 0%
材质类 22 7 68.2%
染色类 40+ 5 ~87.5%
制度类 0 0
动作词 5 4 20%
合计 90+ 30(去重后) ~67%

本书服饰内容丰富,有效条目30条为四书之冠。噪音主要集中在材质类(锦/绮比喻用法)和染色类(青/白/黄自然景色),冠服、衣裳、佩饰类噪音率较低(<25%),因服饰词汇在此类中多为直接引用。