研究总结 日志 原文

《野记》服饰提取日志

任务信息

步骤记录

步骤1:wc -l 检查文件行数

步骤2:多轮grep -n 提取服饰关键词

第1轮:核心词grep

第2轮:制度词grep

第3轮:装饰词grep

第4轮:动作词grep

第5轮:精准词grep

步骤3:sed提取原文片段

步骤4:分类整理

按内容性质分为7大类:

  1. 服饰制度类(行106, 108, 122, 124, 662)——5条
  2. 品服赐服类(行254, 342, 604, 626, 664)——5条
  3. 特殊服饰类(行22, 28, 30, 138, 370, 584, 586, 600)——8条
  4. 卤簿仪仗类(行680)——1条(篇幅极大)
  5. 纺织工艺类(行38, 694)——2条
  6. 人物服饰类(行170, 178, 308, 310, 324, 478, 500)——7条
  7. 服饰罚典类(行710)——1条
  8. 妓女服饰类(行620)——1条

步骤5:产出MD文件

关键词命中统计

类别 关键词 命中条目数
核心词 服色、衣、冠、袍、巾、帛等 100+行(筛选后30条)
制度词 赐绯、绯袍、玉带、金带 4行
装饰词 绣、织、彩、纹 60行(筛选后8条)
动作词 服、冠、戴、著、被 92行(筛选后15条)
精准词 平定巾、尚赤、冠带、吏巾等 30行

数据质量评估