研究总结 日志 原文

皇朝经世文三编 服饰提取日志

任务ID:2-4
操作时间:2026-03-04
源文件:/home/z/my-project/upload/经世文编/经世文编/皇朝经世文三编.txt
输出目录:/home/z/my-project/upload/经世文编output/皇朝经世文三编/


步骤1:文件概况

wc -l 皇朝经世文三编.txt
# 结果:6663行

步骤2:第1轮grep——上位概念关键词

关键词:服饰|舆服|冠服|章服|服色|衣冠|服制

命令

rg -n "服饰|舆服|冠服|章服|服色|衣冠|服制" 皇朝经世文三编.txt | head -200

结果:命中12行,有效服饰相关8行:


步骤3:第2轮grep——冠帽关键词

关键词:冠|冕|弁|帻|巾|帽|幞头|进贤冠|武冠|通天冠|皮弁

命令(Python方式,因编码问题):

keywords = ['冠','冕','弁','帻','巾','帽','幞头','进贤冠','武冠','通天冠','皮弁']

结果:大量命中("冠"字高频),有效服饰相关:

噪音类型:"冠军""冠以""冠盖"等非服饰用法大量存在,需人工筛选。


步骤4:第3轮grep——衣服关键词

关键词:袍|裘|褐|衫|襦|袄|褂|深衣|法服|朝服|祭服|公服|戎服

结果:有效命中:


步骤5:第4轮grep——品色关键词

关键词:紫袍|绯袍|绿袍|青袍|白袍|黄袍|赐紫|赐绯|借紫|品色

结果零命中。该书无品色服制度的相关论述,印证了编者删去"服制"专目的做法。


步骤6:第5轮grep——材质关键词

关键词:锦|绮|帛|绢|绫|罗|缎|绸|缂丝|缯|丝帛|绢帛|绫罗|锦绮

结果:命中极多("罗""帛"等字在姓名、地名中大量出现),有效服饰相关:


步骤7:第6轮grep——配饰关键词

关键词:绶|佩|笏|鱼袋|金带|玉带|革带|鞶囊

结果:有效命中极少:

说明:该书几乎不涉及传统佩饰制度。


步骤8:第7轮grep——动作关键词

关键词:赐服|赐衣|赐帛|赐锦|禁|僭|逾制

过滤条件:对"禁""僭""逾制"等高频词,仅保留含服饰语境的命中。

结果


步骤9:第8轮grep——纺织关键词

关键词:蚕|桑|织|染|绣|缫|练

过滤条件:要求命中行同时含"丝""布""帛""绸""缎""锦""绢""罗""衣""服""蚕""桑""织""染""绣""缫""纺""呢""绒"之一。

结果:命中极多,纺织为全书重要主题。关键行号:


步骤10:关键段落上下文提取

使用Python逐段提取,关键段落:

行号范围 提取内容 有效性
1160-1166 陈耀卿"复旧制"段 ✅ 核心服饰段落
4012-4020 郑观应《典礼上》 ✅ 衣冠演变核心
4016-4022 郑观应《典礼上+下》 ✅ 中西衣冠比较
2950-2958 贵私贵虚论 ✅ 章服虚文
3088-3092 陈炽《阜财裕国》 ✅ 定章服
3395-3400 论二氏 ✅ 革僧道衣冠
4121-4128 使臣服饰 ✅ 服饰与外交
4126-4134 日本易服色 ✅ 异国服制
4180-4188 易服色入公法 ✅ 服色与国际法
4426-4432 侨民衣冠 ✅ 服饰与认同
4765-4770 策论节俭 ✅ 恶衣卑服
5870-5876 俄军戎服 ✅ 军事服饰
6268-6274 土耳其服制 ✅ 异国服制
3856-3866 蚕桑 ✅ 纺织上游

步骤11:筛选与去噪

噪音类型统计

最终有效段落数:22处(见总结篇引用位置表)


步骤12:撰写三份MD