研究总结 日志 原文

湖广通志 服饰内容整理日志

处理对象

提取过程

Step 1:目录创建

Step 2:多轮关键词grep提取

使用egrep对以下关键词组进行逐轮检索:

轮次 关键词 匹配行数 有效服饰内容
1 衣、裳、袍、衫、裙、袄、裤、褂 680 多为地名(锦绣山等)或人名用字
2 甲、胄、铠、冠、帽、帻、巾、笠、盔 数百行 多为"甲于寰区"等成语或地名
3 履、舄、屐、靴、鞋、袜、屦、佩、簪、钗 数百行 履多指"履行",簪钗见列女传
4 缨、绶、带、绫、罗、绸、缎、纱、绢、帛、锦、绮、绣、缂 大量 绢/绫/锦/绣多见于赋税与地名
5 裘、貂、狐、羊皮、染、织、纺、绩、练、蚕、丝、麻、葛、苎 较多 织/绩/蚕/丝/麻/苎见于赋税物产
6 赐服、服色、品色、章服、冠服、舆服、冕服、补服、褐、短褐、布衣、缊袍、龙袍、蟒袍、凤冠、霞帔 数十行 部分有效,如赐服、蟒袍、布衣

Step 3:精简筛选

Step 4:分类整理

将有效内容分为六大类:

  1. 赋税与物产中的纺织品记录
  2. 赐服与章服制度
  3. 人物传记中的服饰描写
  4. 蛮夷服饰风俗
  5. 列女与服饰
  6. 艺文中的服饰意象

Step 5:对抗式审查

难点与处理

  1. 关键词歧义:大量关键词(衣、冠、带、锦、练等)在古文中有多义,需结合上下文判断是否涉及服饰。如"操履"指操行,"冠"指冠军或冠冕均需区分。
  2. 地名干扰:锦绣山、锦湖、紫罗峡等地名占grep结果大半,已全部剔除。
  3. 内容稀疏:作为地理通志,服饰相关内容确实有限,非专志所致,非遗漏。

输出文件