研究总结 日志 原文

唐诗品汇唐诗拾遗 服饰内容提取日志

基本信息

处理流程

Step 1: wc统计

17852 1710421 唐诗品汇唐诗拾遗.txt

Step 2: 5轮grep检索

轮次 关键词类型 匹配行数
第1轮 核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领) 2,133
第2轮 材质复合词 98
第3轮 色彩+服饰复合词 55
第4轮 制度词 20
第5轮 配饰词 146

Step 3: 精确复合词筛选

使用约150个复合服饰词汇进行二次筛选,得到469行精确匹配。

Step 4: 价值度评分筛选

因匹配行数较多,引入价值度评分系统(0-3分):

评分标准:

Step 5: 分类整理

核心条目按5大类分类,详见总结文档。

筛选标准说明

  1. "衣冠":仅保留同时含其他服饰词的条目或具体朝仪描写
  2. "布衣":仅保留描写具体穿着场景的用法
  3. "霓裳":单独出现作文学意象不收,与具体服饰词共现则收录
  4. 赐衣/赐紫/赐锦:全部收录,为重要制度记载
  5. 金紫/银青/金鱼/银鱼:全部收录,为唐代品官服饰制度

问题与备注

  1. 文本含大量评注(刘云、谢云等),需区分原文与评注
  2. 部分诗人生平介绍含服饰制度信息(如"赐紫禅师")
  3. "火浣单衣绣方领茱萸锦带玉盘囊"为全书最具名物价值条目
  4. 越罗(3条)、蜀锦等地方性丝织品需关注