研究总结 日志 原文

后汉书四库——服饰信息提取日志

基本信息

项目 内容
书名 后汉书四库
作者 南朝宋·范煜撰,唐·章怀太子贤注,梁·刘昭补注
文件路径 /home/z/my-project/upload/zhengshi/正史/后汉书四库.txt
文件编码 UTF-8(含少量异常字节,以errors='replace'处理)
总行数 6809
输出路径 /home/z/my-project/upload/正史重制output/后汉书四库/

处理步骤

步骤1:wc -l 统计

步骤2:grep -c 关键词命中统计

关键词 命中行数 关键词 命中行数
203 317
38 48
19 17
42 1
104 15
2 33
进贤冠 5 深衣 5
武冠 5 中衣 10
通天冠 4 4
远游冠 0 4
冕服 4 半袖 0
朝服 12 衮服 0
祭服 8 常服 10
公服 2 法服 4
章服 3 燕服 0
丧服 11 87
0 绿 18
233 555
446 47
258 9
58 4
85 221
鱼袋 0 鞶囊 0
香囊 0 11
3 步摇 1
舆服 38 车服 22
卤簿 14 仪仗 0
155 13
26 5
61 27
0 6
2 52
9 14
赐服 0 赐紫 0
赐绯 0 借紫 0
借绯 0 服制 6
冠制 4 品色 0
服色 5 冠带 9

说明:黄(555)、白(446)、朱(258)、青(233)等颜色词大量出现,但多数并非服饰语境(如人名、地名、自然描写)。实际服饰相关需结合上下文判断。

步骤3:grep -n 关键行定位

舆服志核心段落

礼仪志服饰段落

帝纪服饰段落

列传服饰段落

步骤4:sed上下文提取

采用Python逐行提取,对关键段落取完整行内容(因行较长,含丰富注释),未使用传统sed上下文扩展。

步骤5-6:撰写三份MD并写入


服饰信息分布特征

  1. 集中性:服饰制度核心内容高度集中于舆服志上下两卷(L3254-L3331),约占全文0.6%的篇幅
  2. 分散性:礼仪志及纪传中散见大量服制实践记录
  3. 注释丰富:四库本保留大量蔡邕、胡广、应劭等人的汉制注释
  4. 无唐代服饰:全书为东汉制度,无赐紫/赐绯/借紫/借绯/品色/鱼袋等唐代以后概念
  5. 绶色为纲:东汉以绶色区分等级,与唐以后以服色为主不同