研究总结 日志 原文

新元史 服饰史料提取日志

基本信息

处理步骤

步骤1:文件行数统计

wc -l 新元史.txt → 39700

步骤2:关键词命中统计

执行 grep -c 对78个服饰关键词逐一统计,结果如下:

关键词 命中 关键词 命中 关键词 命中
49 25 3
108 63 幞头 51
进贤冠 1 通天冠 7 499
18 90 28
6 14 63
深衣 4 4 14
5 衮服 1 冕服 8
朝服 19 祭服 10 常服 3
公服 52 法服 15 章服 4
燕服 5 丧服 3 214
71 绿 67 423
836 1025 382
395 13 437
71 585 46
香囊 1 14 2
步摇 1 舆服 7 卤簿 22
仪仗 24 210 53
25 31 952
199 41 36
16 20 1
1 借紫 4 服制 5
服色 20 冠带 6

步骤3:关键行号提取

通过 grep -n 定位核心段落:

舆服志核心区域

礼志相关区域

本纪相关

步骤4:上下文提取

使用 sed -n 提取关键段落全文:

步骤5:产出文件

  1. 新元史_总结.md — 服饰史料综述
  2. 新元史_日志.md — 本文件
  3. 新元史_原文提取.md — 核心原文节选

备注