研究总结 日志 原文

皇朝经世文续编(清·饶玉成)服饰提取日志

任务ID:2-3
操作时间:2026-03-04
文件:皇朝经世文续编-清-饶玉成.txt(8279行)


第1轮:上位概念关键词

命令grep -n '服饰|舆服|冠服|章服|服色|衣冠|服制' 文件 | head -200

结果数量:约30+条命中

关键行号

噪音过滤:多数"衣冠"为比喻用法(指士人阶层),非具体服饰描写;"服制"在大多数语境下指丧服制度而非日常服饰制度。


第2轮:冠帽关键词

命令:Grep搜索'冕|弁|帻|幞头|进贤冠|武冠|通天冠|皮弁'

结果数量:约15条命中

有效命中

噪音:大量"弁"为武弁(武官)之意,与冠帽无关,已过滤。


第3轮:衣服关键词

命令grep -n '袍|裘|褐|衫|襦|袄|褂|深衣|法服|朝服|祭服|公服|戎服'

结果数量:约20条命中

有效命中

噪音:"冬裘夏葛"为比喻用法,"箕裘"为成语,均过滤。


第4轮:品色关键词

命令:Grep搜索'紫袍|绯袍|绿袍|青袍|白袍|黄袍|赐紫|赐绯|借紫|品色'

结果数量:0条命中

结论:本书不含官服品色等级制度的论述。


第5轮:材质关键词

命令grep -n '锦|绮|帛|绢|绫|罗|缎|绸|缂丝|缯|丝帛|绢帛|绫罗|锦绮'

结果数量:大量命中(词频高,多为人名地名)

有效命中

噪音:大量人名含"罗""帛"等字(如罗泽南、罗汝怀、帛等),地名含"罗"(罗布淖尔等),需逐一甄别。


第6轮:配饰关键词

命令:Grep搜索'绶|佩|笏|鱼袋|金带|玉带|革带|鞶囊'

结果数量:约15条命中

有效命中

噪音:张佩纶等人名含"佩",笏堂为字号,大量为非服饰用例。


第7轮:动作关键词

命令:Grep搜索'赐服|赐衣|赐帛|赐锦|僭|逾制'

结果数量:约10条命中

有效命中

噪音:"僭越"多用于政治僭越而非服饰僭越,需甄别。


第8轮:纺织关键词

命令grep -n '蚕|桑|织|染|绣|缫|练'

结果数量:大量命中

有效命中

噪音:"练兵""团练"占绝大比例,"桑"多用于"沧桑"等,需严格过滤。


提取上下文操作

对以下关键行号执行了 sed -n '起始行,结束行p' 提取:


统计汇总

轮次 关键词类 命中总数 有效命中 噪音率
1 上位概念 30+ 22 ~27%
2 冠帽 15 3 80%
3 衣服 20 9 55%
4 品色 0 0 N/A
5 材质 50+ 7 86%
6 配饰 15 4 73%
7 动作 10 3 70%
8 纺织 100+ 6 94%

总有效服饰片段:约30处,涵盖丧服制度、宫廷服制、节俭崇俭、品服名器、纺织蚕桑五个主要方面。