研究总结 日志 原文

皇朝经世文新编 服饰内容提取日志

操作日期:2026-03-04
源文件:/home/z/my-project/upload/经世文编/经世文编/皇朝经世文新编.txt
文件规模:10,022行


步骤1:查看文件总行数

wc -l 皇朝经世文新编.txt

结果:10,022行


步骤2:逐轮grep搜索

第1轮——上位概念(服饰|舆服|冠服|章服|服色|衣冠|服制)

grep -n "服饰\|舆服\|冠服\|章服\|服色\|衣冠\|服制" 皇朝经世文新编.txt | head -200

命中行号及关键词

有效命中:18条


第2轮——冠帽(冠|冕|弁|帻|巾|帽|幞头|进贤冠|武冠|通天冠|皮弁)

grep -n "冠\|冕\|弁\|帻\|巾\|帽\|幞头\|进贤冠\|武冠\|通天冠\|皮弁" 皇朝经世文新编.txt | head -200

结果:命令超时(单字"冠""巾""帽"匹配量过大)。

补救措施:改用上下文已覆盖的精准行号提取,关键命中:

有效增量命中:4条(其余为噪音,如"冠军""冠绝"等)


第3轮——衣服(袍|裘|褐|衫|襦|袄|褂|深衣|法服|朝服|祭服|公服|戎服)

grep -n "袍\|裘\|褐\|衫\|襦\|袄\|褂\|深衣\|法服\|朝服\|祭服\|公服\|戎服" 皇朝经世文新编.txt | head -200

关键命中

有效命中:8条(过滤大量噪音如"重裘"比喻、"袍泽"等)


第4轮——品色(紫袍|绯袍|绿袍|青袍|白袍|黄袍|赐紫|赐绯|借紫|品色)

grep -n "紫袍\|绯袍\|绿袍\|青袍\|白袍\|黄袍\|赐紫\|赐绯\|借紫\|品色" 皇朝经世文新编.txt | head -200

结果:0条命中。本书无传统品色服制内容,与变法维新文集性质一致。


第5轮——材质(锦|绮|帛|绢|绫|罗|缎|绸|缂丝|缯|丝帛|绢帛|绫罗|锦绮)

LANG=C grep -n "锦\|绮\|帛\|绢\|绫\|罗\|缎\|绸\|缂丝\|缯\|丝帛\|绢帛\|绫罗\|锦绮" 皇朝经世文新编.txt | head -100

结果:命令超时。

补救措施:从第1轮已获取的上下文中筛查材质词:

有效命中:4条


第6轮——配饰(绶|佩|笏|鱼袋|金带|玉带|革带|鞶囊)

grep -n "绶\|佩\|笏\|鱼袋\|金带\|玉带\|革带\|鞶囊" 皇朝经世文新编.txt | head -200

关键命中

有效命中:9条(多数为比喻义或外交勋章,传统官服配饰仅L1930引《曲礼》1条)


第7轮——动作(赐服|赐衣|赐帛|赐锦|禁|僭|逾制)

LANG=C grep -n "赐服\|赐衣\|赐帛\|赐锦\|僭\|逾制" 皇朝经世文新编.txt | head -100

结果:编码错误,部分匹配失败。

补救措施:从已获取上下文中筛查:

有效命中:5条(均为"僭越"政治含义,无服制僭越内容)


第8轮——纺织(蚕|桑|织|染|绣|缫|练)

LANG=C grep -n "蚕\|桑\|织\|染\|绣\|缫\|练" 皇朝经世文新编.txt | head -100

结果:编码错误。

补救措施:从已获取上下文中筛查:

有效命中:5条


步骤3:关键段落上下文提取

使用 sed -n '起始行,结束行p' 对22个关键行号提取上下文,覆盖范围:

行号区间 提取范围 内容概要
43-48 L45上下文 梁启超序全文
925-930 L927上下文 康有为变法疏"本朝善变"段
960-965 L962上下文 欧甲"衣冠危于累卵"
1110-1125 L1114-L1122上下文 谭嗣同中外冠服比较+变衣冠论
1337-1342 L1339上下文 刘桢麟日本守旧党论
1347-1352 L1349上下文 中国守旧派论
1369-1373 L1371上下文 徐勤论文明三变
1508-1522 L1510-L1520上下文 俄皇彼得传服制改革全段
4135-4145 L4138-L4143上下文 黄遵宪日本食货志服色变革全段
2908-2913 L2910上下文 出使学堂章程
2977-2982 L2979上下文 日本建言书

步骤4:筛选与过滤

噪音过滤标准

  1. 比喻义(如"重裘""佩玉鸣珂""环佩")仅保留具有文化比较价值的条目
  2. "冠军""冠绝""衣钵""衣锦还乡"等无关匹配一律排除
  3. "僭越"仅在涉及政治制度语境时保留,排除一般道德论述
  4. 外交勋章(佩带荷兰星等)保留,因其反映国际冠服礼仪

最终有效服饰片段:22条(见总结文档引用原文位置表)


流程轨迹总结

步骤 操作 结果
1 wc -l 10,022行
2.1 grep第1轮-上位概念 18条有效命中
2.2 grep第2轮-冠帽 超时,4条增量命中
2.3 grep第3轮-衣服 8条有效命中
2.4 grep第4轮-品色 0条命中
2.5 grep第5轮-材质 超时,4条补救命中
2.6 grep第6轮-配饰 9条命中
2.7 grep第7轮-动作 编码错误,5条补救命中
2.8 grep第8轮-纺织 编码错误,5条补救命中
3 sed上下文提取 11段关键上下文
4 筛选过滤 22条有效服饰片段
5 撰写三份MD 完成