研究总结 日志 原文

《声律启蒙-清-车万育》服饰提取日志

Step 1:文件基本信息

Step 2:关键词grep定位

Step 3:噪音过滤

Step 4:有效服饰条目筛选

经逐行审核,确认为服饰内容的有效条目约35处,分布如下:

Step 5:产出文件

踩坑记录

  1. 颜色词命中率极高(约占总命中60%+),需逐条判断是否为织物/服饰语境
  2. "青衣"一词在本书中有两种用法:一为服饰(青色衣裳),二为身份代称(婢仆),需区分
  3. "裳"字出现少且多为典故用法(蓉裳、霓裳),非日常服饰描写
  4. 本书为对仗教材,服饰词均为修辞需要,非纪实性描述

审核确认