研究总结 日志 原文

禹贡锥指 — 服饰内容提取日志

基本信息

搜索过程

第一轮:衣/裳/裘/弁/冕/服

关键词 命中行数 服饰义行数 主要噪声
35行 约8行 青衣=地名约10处、衣用=民生泛称
2行 2行
5行 2行 千金之裘=比喻1处
4行 1行 弁辰/弁韩=族名2处、王弁=人名1处
4行 1行 冕山营=地名1处
119行 约6行 地域义约50处、服从/服行约60处

第二轮:冠/带/佩/舄/芾/韨

关键词 命中行数 服饰义行数 主要噪声
19行 约2行 冠石山=地名2处、冠氏县=地名1处、冠篇首=编排义
40行 约2行 襟带=地理2处、带方=地名1处
11行 约2行 佩服=比喻多处
8行 1行 舄卤=地理术语6处
0行
0行

第三轮:黼/黻/绣/衮/皮弁/章服

关键词 命中行数 服饰义行数 主要噪声
0行
0行
4行 3行
2行 1行 端委以治1处=间接服饰义
皮弁 0行
章服 0行

第四轮:玄衣/黄裳/赤舄/采服/锡服/絺冕

关键词 命中行数 服饰义行数
全部 1行 0行(采服=地域义)

第五轮:五服/五采/山龙/华虫/宗彝/藻火/粉米

关键词 命中行数 服饰义行数 主要噪声
五服 26行 0行 全部为地域/行政区划义
五采 3行 2行
山龙 3行 0行 均为地名/装饰品引用
华虫-粉米 0行

补充轮:丝/帛/织/缟/纩/锦/絺/檿丝/罽/卉服/玄纤

关键词 命中行数 服饰义行数 主要噪声
23行 约15行 理乱丝=比喻2处
12行 约8行
27行 约15行 织以为器=非服饰5处
10行 10行
5行 5行
13行 约7行 锦州/辰锦/锦缆石=地名6处
8行 7行 絺结=比喻1处
檿丝 7行 7行
3行 2行 罽宾=地名1处
卉服 6行 6行
玄纤 0行

甄别过程

高噪声关键词处理

  1. 服字(119处命中→6处有效,噪声率95%)
    • 排除:五服=地域义约50处、服从/服行/服贾约40处、侯服/甸服/男服约15处
  2. 衣字(35处命中→8处有效,噪声率77%)
    • 排除:青衣县/山/水=地名约10处、衣用=泛称、衣德言=比喻
  3. 舄字(8处命中→1处有效,噪声率87.5%)
    • 排除:舄卤=地理术语6处、松桷有舄=建筑术语1处
  4. 冠字(19处命中→2处有效,噪声率89%)
    • 排除:冠石山/冠氏县=地名3处、冠篇首=编排义2处
  5. 锦字(13处命中→7处有效,噪声率46%)
    • 排除:卢阳锦/辰锦/锦缆石=地名6处
  6. 带字(40处命中→2处有效,噪声率95%)
    • 排除:襟带=地理2处、带方=地名1处、水带=地理约35处

特殊用法排除

最终统计