研究总结 日志 原文

《黄帝素问》服饰内容提取 · 操作日志

时间:2026-04-19 任务:提取《古今图书集成·博物汇编·艺术典·医部全录·黄帝素问》全部服饰相关内容


Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/古今图书集成博物汇编艺术典医部全录output/黄帝素问/

✅ 目录创建成功


Step 2: 文件概况

wc -l 黄帝素问.txt

结果:2487行


Step 3: 全量关键词搜索

3.1 复合词搜索(服制、冠服等)

grep -n '衣裳\|衮冕\|衣冠\|布衣\|服章\|章服\|黼黻\|深衣\|祭服\|朝服\|丧服\|舆服\|冠服\|服色\|服制' 黄帝素问.txt

结果:

3.2 更多服饰关键词搜索

grep -n '被服\|衣裘\|衮服\|衣禁\|裘\|冠\|冕' 黄帝素问.txt

结果:

3.3 褐、丝绵、毛布搜索

grep -n '不衣而褐\|衣褐\|褐荐\|丝绵\|毛布' 黄帝素问.txt

结果:

3.4 医学禁衣搜索

grep -n '热衣\|寒衣\|濡衣\|温衣\|炙衣\|单衣\|衣上\|衣常' 黄帝素问.txt

结果:

3.5 社会等级词搜索

grep -n '布衣' 黄帝素问.txt

结果:

3.6 冠带搜索

grep -n '冠带' 黄帝素问.txt

结果:


Step 4: 全文宽搜索(排除噪声)

对全部2487行执行宽搜索(衣/裳/裘/冠/冕/弁/帽/巾/帻/佩/带/帛/锦/绣/染/纹/履/舄/靴/鞋/袜/袍/裙/衫/袄/褐/丝/麻/葛/棉/布),共命中501行。

但其中绝大多数为同字异义之中医术语噪声,如:

经逐行人工甄别,排除噪声后确认有效服饰匹配行约17处


Step 5: 原文行验证

使用Python逐行读取,验证每条引用的行号与内容对应关系:

with open('黄帝素问.txt', 'r', encoding='utf-8', errors='replace') as f:
    lines = f.readlines()
for ln in [5, 51, 54, 522, 531, 532, 533, 534, 597, 600, 644, 
           1106, 1107, 1108, 1109, 1112, 1113, 1116, 1118, 
           1222, 1345, 1500, 1873, 2334, 2404]:
    print(f'LINE {ln}: {lines[ln-1][:200]}')

✅ 全部行号与内容对应正确


Step 6: 保存三份文件


关键发现

  1. 本书为纯医典,服饰内容极少,全部2487行中仅约17处有效匹配
  2. 五脏禁衣之制是本书最系统的服饰内容:心禁热衣、脾禁濡衣、肺禁寒衣、肾禁炙衣
  3. 西方之民不衣而褐荐是唯一涉及具体衣料(丝绵、毛布、褐)的记载
  4. 布衣在本书中为平民代称,构成与"大人"的医疗等级对比
  5. 衮冕、黻冕、章服仅出现在注文的历史叙述中

踩坑记录