研究总结 日志 原文

后汉书八家辑注 — 服饰提取日志

基本信息

处理流程

步骤1:文件统计

步骤2:关键词grep统计

使用服饰关键词词库,分8大类逐一grep -c统计:

关键词 命中行数 备注
36 含"冠族""冠军"等非服饰用法约11条
2 均为服饰相关
1 皮弁素积
7 均为服饰相关
34 含"黄巾"约15条(起义相关非服饰)
帽/幞头/武冠/通天冠/远游冠 0 无命中
进贤冠 1 狗着进贤冠
85 含大量非服饰用法,过滤后约40条服饰相关
6 均为服饰相关
5 均为服饰相关
3 均为服饰相关
5 含地名"菟裘"1条
4 均为服饰相关
3 均为服饰相关
衫/袄/深衣/中衣/裤/半袖 0 无命中
朝服 4 均为服饰相关
丧服 2 均为服饰相关
常服 1 常服麤粝
服制 1 衣冠车服制度
衮服/冕服/祭服/公服/法服/章服/燕服 0 无命中
8 含"紫芝""紫宫"等非服饰约3条
1 绯囊(非服饰,石灰囊)
绿 3 含地名等
41 绝大多数非服饰,"青绶"2条有效
1285 绝大多数为人名/年号,"黄巾"约15条有效
97 "白衣""白布"等约5条有效
14 "黑帻"2条有效
141 "朱衣"等极少服饰用法
1 地名,非服饰
18 佩刀/佩韦/佩印绶,约15条有效
25 均为服饰相关(印绶制度)
16 服饰相关约6条(革带/腰带)
笏/鱼袋/鞶囊/香囊/簪/钗 0 无命中
步摇 1 目录条目
舆服 7 均为制度相关
车服 2 均为制度相关
卤簿/仪仗 0 无命中
16 约12条服饰相关
6 约4条服饰相关
2 1条有效
1 有效
14 约2条服饰相关(罗縠)
5 约2条服饰相关(锦被)
6 约5条服饰相关
缎/纱/绸/缟/纨 0 无命中
赐服/赐紫/赐绯/借紫/借绯/品色/服色/冠带 0 无命中

步骤3:grep -n提取行号

对有效关键词执行grep -n提取行号,然后对高频单字关键词(衣/冠/巾/带等)附加二次过滤条件(如"衣冠|布衣|衣服|单衣|衣不|赐衣"等),剔除人名、地名、成语等非服饰用法。

步骤4:sed上下文提取

对关键行号执行sed -n提取原文,人工审阅确认服饰相关性。

步骤5:分类编排

将筛选后的约120条有效服饰信息按8大类编排:

  1. 冠帽类(冕/弁/帻/巾/冠)
  2. 衣裳类(衣/裳/袍/褐/裘/襦/裙)
  3. 服制类(朝服/丧服/常服/服制/服妖)
  4. 颜色服饰类(紫/绛/赤/黑/皁/白/绶)
  5. 佩饰类(佩/带/步摇)
  6. 舆服/车服类
  7. 织物类(帛/绢/罗/锦/缯/绫/绮)
  8. 妆饰类(髻/妆/脂粉)

步骤6:撰写3份MD

数据质量问题

  1. "黄巾"非服饰:34条"巾"命中中约15条为"黄巾"起义相关,已排除。
  2. "冠族/冠军"非服饰:36条"冠"命中中约11条为"冠族""冠军"等非服饰用法,已排除。
  3. 高频率色词:黄(1285)、朱(141)、白(97)、青(41)等单字色词命中极多,绝大多数非服饰用法,仅提取组合词(如"黄巾""朱衣""皁袍"等)。
  4. "绯"字:唯一命中"绯囊"实为石灰囊,非服饰。
  5. 辑佚局限:本书为辑佚之作,服饰记载零散不成系统,无完整舆服志内容,但保存了若干佚史中的珍贵片段。

输出文件

文件名 说明
后汉书八家辑注_总结.md 服饰内容分类总结
后汉书八家辑注_日志.md 处理流程日志(本文件)
后汉书八家辑注_原文提取.md 服饰相关原文提取