研究总结 日志 原文

《觚剩及续编》服饰内容提取日志

基本信息

处理流程

第一步:文件概览

第二步:多轮关键词grep

第一轮:制度词搜索

第二轮:核心服饰词搜索

第三轮:织物词搜索

第四轮:材质词搜索

第五轮:制度词搜索

第六轮:装饰词搜索

第七轮:动作词搜索

第三步:sed提取关键段落

提取了以下关键段落的上下文:

第四步:分类整理

将提取内容分为五类:

  1. 人物服饰描写(10条)
  2. 服饰制度与品级(4条)
  3. 织物与工艺(6条)
  4. 刺绣与装饰(3条)
  5. 丧服与特殊服饰(2条)

第五步:产出MD文件

质量控制