研究总结 日志 原文

禹贡论 服饰内容提取日志

基本信息

关键词搜索记录

第一轮:衣/裳/裘/弁/冕/服

关键词 命中行数 服饰义行数 说明
1行 0行 L836"抠衣彭公之门"=登门求教之礼节动作,非服饰描述
0行 0行
0行 0行
0行 0行
0行 0行
16次/4行 1次 L127"服虔"=人名;L139"克服""侯服""宾服""夷服"=征服/地域区划;L141"五服五流"=刑罚制度;L143"服从""荒服""近服"=服从/地域区划;L143"服食器用"=衣服·饮食·器皿·用具(唯一服饰义)

第二轮:冠/带/佩/舄/芾/韨

关键词 命中行数 服饰义行数 说明
0行 0行
1行 0行 L118"横带天地西南之半"=横贯比喻,非服饰
0行 0行
0行 0行
0行 0行
0行 0行

第三轮:黼/黻/绣/衮/皮弁/章服

关键词 命中行数 服饰义行数 说明
0行 0行
0行 0行
0行 0行
0行 0行
皮弁 0行 0行
章服 0行 0行

第四轮:玄衣/黄裳/赤舄/采服/锡服/絺冕

关键词 命中行数 服饰义行数 说明
玄衣 0行 0行
黄裳 0行 0行
赤舄 0行 0行
采服 0行 0行
锡服 0行 0行
絺冕 0行 0行

第五轮:五服/五采/山龙/华虫/宗彝/藻火/粉米

关键词 命中行数 服饰义行数 说明
五服 1行 0行 L141"五服五流"=五种刑罚与五种流放,非服饰五服
五采 0行 0行
山龙 0行 0行
华虫 0行 0行
宗彝 0行 0行
藻火 0行 0行
粉米 0行 0行

补充轮:丝/帛/织/缟/纩/锦/絺/檿丝/罽/卉服

关键词 命中行数 服饰义行数 说明
0行 0行
0行 0行
1行 1行 L131"织贝"=扬州入篚织物贡品
1行 1行 L131"珠鱼缟"/"珠玄缟"=徐州入篚丝织贡品
0行 0行
0行 0行
0行 0行
檿丝 0行 0行
1行 0行 L114"罽宾"=西域国名(Kashmir/Jibin),非毡罽服饰
卉服 0行 0行

噪声排除统计

类别 排除数 典型用例
服=地域区划 8处 侯服、宾服、夷服、荒服、近服
服=刑罚制度 2处 五服五流
服=征服/服从 3处 克服、服从(×2)
服=人名 1处 服虔(汉代学者)
衣=礼节动作 1处 抠衣(提衣登门之礼)
带=比喻 1处 横带天地(横贯比喻)
罽=国名 1处 罽宾(西域国名)
合计排除 17处

有效服饰条目汇总

序号 关键词 位置 类别 服饰义
1 织贝 L131 织物贡品 扬州入篚织物,织成贝纹之丝织品
2 L131 织物贡品 徐州入篚丝织品,白色精细丝帛
3 玄缟 L131 织物贡品 玄(赤黑色)与缟(白色)丝织品并称
4 服食器用 L143 服制概念 引《旅獒》,衣服为四方贡物四类之一

有效条目:4处 | 排除噪声:17处 | 服字噪声率:94%(15/16次为非服饰义)

提取方法

全程使用Python脚本进行关键词搜索与上下文提取,对每个命中行提取前后80字符上下文,逐条甄别服饰义与非服饰义。因本书848行规模适中,bash grep亦可正常工作,但为保持与系列处理一致性,统一使用Python方案。