研究总结 日志 原文

《四字鉴略》服饰逐本整理日志

基本信息

项目 内容
书名 《四字鉴略》
作者 清·王仕云
源文件 /home/z/my-project/upload/启蒙蒙学/四字鉴略.txt
文件行数 230行
文件大小 14,286字节
文体 四字韵文历史蒙学

工作流程

第一步:文件信息获取

wc -l → 230行
wc -c → 14,286字节

文件体量较小,为典型的蒙学韵文读物。

第二步:多轮关键词检索

第一轮:核心服饰词检索(衣裳服冠冕弁帻巾帽履舄靴鞋袜裘袍衫襦裙裤褐袂领袖带佩笏绶簪钗钿珰环玦璧琼)

命中行号:24、40、81、95、148

第二轮:织物材质词检索(佩玉衣裳冠带布衣锦绮罗纱绢帛丝缎绸绫缟絺绤葛麻布绵絮衮黼黻纹绣织染)

命中行号:81、140

第三轮:颜色与制度词检索(青赤黄白黑玄朱紫绿绯赭龙袍章服朝服祭服丧服常服吉服戎服冕服皮弁进贤冠武冠幞头鱼袋革带大带蔽膝方心曲领霞帔凤冠顶戴花翎补服蟒袍甲铠兜鍪旒旂旗)

命中行号:8、23、38、65、71、86、87、95、98、103、115、134、138、148、154、157

逐一甄别:

第四轮:军戎器物词检索(旗旒旂旆麾帜)

无命中。

第五轮:配饰器物词检索(绶笏簪钗钿珰璧琼玦环)

命中行号:81(冠带环门之"环",经辨析为"环绕"义,非佩环)

第六轮:军戎甲胄词检索(胄兜鍪盔铠甲兵铁甲金甲)

命中行号:145、193

第七轮:礼仪制度词检索(九锡禅冕朝祭丧吉凶)

命中行号:97

第八轮:旗帜仪仗词检索(旌)

命中行号:15

第九轮:衣襟卧具词检索(衽席)

命中行号:135

第三步:去噪过滤

经逐条甄别,排除以下类型:

排除类型 示例 数量
姓名用字 黄霸、朱季、黄宪、玄德、玄宗、黄皓、黄巢、朱温 8处
非服饰义 履癸(人名)、嗣服(继承)、环门(环绕) 3处
非织物义 罗钳(人名) 1处
非服色义 白鱼(鱼色)、戎狄(军事) 2处

最终保留有效服饰条目:8条

第四步:分类整理

将8条有效内容按主题归类:

第五步:写入三份MD文档


检索统计

检索轮次 关键词类别 命中行数 有效条目
第一轮 核心服饰词 5行 3条
第二轮 织物材质词 2行 0条(均重复)
第三轮 颜色与制度词 16行 0条(均为姓氏/人名)
第四轮 军戎器物词 0行 0条
第五轮 配饰器物词 1行 0条
第六轮 甲胄词 2行 1条
第七轮 礼仪制度词 1行 1条
第八轮 旗帜仪仗词 1行 1条
第九轮 衣襟卧具词 1行 1条
合计 29行次 8条(去重后)

去噪率:29行次命中 → 8条有效,去噪率约72.4%