研究总结 日志 原文

梁书服饰信息提取日志

基本信息

处理步骤

步骤1:文件行数统计

wc -l 梁书.txt → 1801行

步骤2:关键词命中统计(grep -c)

共检测72个服饰关键词,其中有效命中(≥1行)的关键词如下:

关键词 命中行数 关键词 命中行数
171 160
23 11
7 11
2 5
15 21
11 11
武冠 1 7
远游冠 3 4
衮服 1 1
朝服 21 76
祭服 1 绿 6
法服 3 96
丧服 5 159
服制 3 152
服色 1 14
舆服 1 7
车服 6 10
卤簿 3 72
38 12
19 7
14 2
1 21
61 3
6 3
3

零命中关键词:幞头、进贤冠、通天冠、半袖、常服、公服、章服、燕服、绯、朱、笏、鱼袋、鞶囊、香囊、步摇、仪仗、缎、缯、赐服、赐紫、赐绯、借紫、借绯、冠制、品色、冠带

步骤3:关键词行号提取(grep -n)

分五批提取:

  1. 服制类(衮服/冕服/朝服/祭服等)→ 命中约40行
  2. 冠冕类(冕/弁/帻/远游冠等)→ 命中约35行
  3. 衣裳类(袍/衫/袄/褐/裘等)→ 命中约60行
  4. 佩饰类(佩/绶/簪/钗等)→ 命中约30行
  5. 织物类(帛/绢/绮/罗/锦等)→ 命中约80行

步骤4:上下文提取(sed)

对关键行提取上下文,确认服饰信息实质内容。

步骤5:重要发现

高价值段落(含多条服饰信息)

服饰制度核心段落

步骤6:产出文件

  1. 梁书_总结.md — 服饰文化综合总结
  2. 梁书_日志.md — 本文件,处理过程记录
  3. 梁书_原文提取.md — 服饰相关原文摘录

注意事项