《孟子注疏》服饰提取日志

处理日期:2026-03-05 输入:/home/z/my-project/upload/四书/四书/孟子注疏.txt 输出:/home/z/my-project/upload/四书output/孟子注疏/


基本信息

项目
书名 孟子注疏
注者 汉·赵岐
疏者 宋·孙奭
文件大小 1,000,958字节
总行数 623行
8轮grep总命中行 327行(去重)
有效服饰行 42条

操作流程

Step 1:环境准备

mkdir -p "/home/z/my-project/upload/四书output/孟子注疏"
wc -c 孟子注疏.txt  # 1000958
wc -l 孟子注疏.txt  # 623

Step 2:8轮关键词grep

第1轮:衣裳裘冠冕弁巾帻帽

rg -n '[衣裳裘冠冕弁巾帻帽]' 孟子注疏.txt
# 命中66行,行号:10,34,58,59,67,87,91,100,101,102,103...
# 筛选后有效:行58(衣帛),行67(衣帛重出),行100(裘),行102(衣衾),行167(衣褐),行175(冠),行176(冠礼),行304(巾帽),行312(缨冠),行346(朝衣朝冠),行520(衣服),行554(画衣)

第2轮:服袍衫裙裤褐襦袂裾

rg -n '[服袍衫裙裤褐襦袂裾]' 孟子注疏.txt
# 命中76行
# 有效:行167(衣褐),行177(衣服),行503(服衮),行507(儒衣书服),行520(衣服),行554(画衣)

第3轮:佩饰带绶笏鱼袋玉

rg -n '[佩饰带绶笏鱼袋玉]' 孟子注疏.txt
# 命中73行
# 有效:行3(赐紫金鱼袋),行359-360(执质/六瑞六贽)
# 注:大量"玉"为泛用,非服饰

第4轮:丝帛绢锦绮绫罗缎绸缂

rg -n '[丝帛绢锦绮绫罗缎绸缂]' 孟子注疏.txt
# 命中40行
# 有效:行91(玄黄/丝帛),行101(缯帛/锦),行555(絺绣)

第5轮:麻葛布绵裘褐毡

rg -n '[麻葛布绵裘褐毡]' 孟子注疏.txt
# 命中52行
# 有效:行100-101(狐貉之裘),行167-168(褐),行192-193(辟纟卢/麻),行597-598(布缕)

第6轮:舄履屦靴鞋

rg -n '[舄履屦靴鞋]' 孟子注疏.txt
# 命中30行
# 有效:行167-168(捆屦),行192-193(织屦),行380-381(不知足而为屦)
# 注:大量"履"为"履行"义非鞋履

第7轮:染青赤朱黄白黑玄紫

rg -n '[染青赤朱黄白黑玄紫]' 孟子注疏.txt
# 命中101行
# 有效:行19-20(红紫乱朱/五方色论),行182(牺牲色纯)
# 注:颜色词泛用极高,绝大多数"黄""白""黑"非服饰义

第8轮:旌旗旂盖帷帐幕

rg -n '[旌旗旂盖帷帐幕]' 孟子注疏.txt
# 命中197行
# 有效:行173-174(招虞人以旌),行87(大白之旗)
# 注:"旗"在军事语境中使用极多,与服饰相关仅招虞人礼节

Step 3:精确筛选

在8轮宽搜基础上,使用更精确的组合关键词二次筛选:

rg -n '衣帛|衣裘|衣衾|衣冠|衣裳|衣紫|衣褐|衣锦|冠冕|弁|冕服|狐裘|裘褐|佩玉|大带|革带|绅带|绶|笏|鱼袋|金鱼|缯帛|锦衣|葛屦|屦|赤舄|舄|服色|章服|正色|间色|红紫|紫夺|旌旗|帷|巾|帻|帽|皮币|狐貉|絺绤|布衣|冠者|加冠|丧服|皮弁|玄黄' 孟子注疏.txt

命中42个唯一行号。

Step 4:逐行内容提取

用Python脚本提取42行完整内容,逐一判读服饰相关性,确认全部42条有效。

Step 5:撰写三份MD

文件 大小 内容
原文提取.md 8,301B 42条原文按8轮分类摘录
总结.md 6,484B 结构化综述+对抗式审查
日志.md 本文件 全流程操作记录

关键发现

  1. 衣帛三出:同一论述在《梁惠王上》出现两次(行58、行67),《尽心下》一次(行490),赵注简略而疏引《王制》补充
  2. 五方色论为注疏独有:经文仅"红紫乱朱"四字,疏文扩展为完整的五方正色/间色体系,是先秦服色理论的重要文献
  3. 六瑞六贽系统:行360疏文完整列出公侯伯子男执圭璧、卿大夫士执禽鸟的礼制,此为注疏增补
  4. 服饰与政治深度绑定:孟子服饰论述几乎全部服务于仁政、礼制、正邪之辨,无纯粹装饰性描写

踩坑记录

问题 应对
颜色词泛用极高 第7轮101行命中仅3行有效,须逐行人工筛选
"旗"军事语境泛滥 第8轮197行命中仅2行有效
"履"多作动词"履行" 需结合上下文判断是否为鞋履义
"裘"在"皮币"注中 "裘"非经文而是赵注释义
编码问题 部分字符为生僻异体(纟卢、衤画、駠),用errors='replace'处理

日志完成。三份MD均已写入 /home/z/my-project/upload/四书output/孟子注疏/ 目录。