古今禅藻集 服饰提取日志
操作时间:2026-03-05 文件:/home/z/my-project/upload/诗集/诗集/古今禅藻集.txt 总行数:5898
操作记录
步骤1:文件大小检查
wc -l 古今禅藻集.txt
# 结果:5898行
步骤2:5轮grep关键词统计
| 轮次 | 关键词类 | grep命令 | 匹配行数 |
|---|---|---|---|
| 1 | 核心词(衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领) | rg -c '[衣裳裘冠冕弁帻巾帽佩玉带绶笏舄履靴袍衫裙褶袂襟领]' |
719 |
| 2 | 材质(锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧) | rg -c '[锦绮绢帛丝缎绫罗纱缟绸葛麻褐布绵茧]' |
318 |
| 3 | 色彩纹饰(紫绯朱赭青绿白玄黄丹素绣纹章黼黻华) | rg -c '[紫绯朱赭青绿白玄黄丹素绣纹章黼黻华]' |
1384 |
| 4 | 制度(服赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮) | rg -c '[服赐服赐紫赐绯品色舆服章服冠服朝服祭服丧服常服加冠衮]' |
878 |
| 5 | 配饰(簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼) | rg -c '[簪钗钿珰珥环镯鱼袋幞头云肩霞帔蔽膝芾韠佩鱼]' |
1370 |
说明:单字grep噪声极大(如"衣"可出现在"衣钵"等非服饰语境,"华"出现极频),第1轮719行需大量过滤。
步骤3:精确词组grep
| 轮次 | 精确词组grep | 匹配行数 |
|---|---|---|
| 1 | 衣裳|衣冠|冠冕|巾帽|佩玉|玉带|绶|笏|舄|履|靴|袍|衫|裙|褶|袂|裘|弁|帻 | 163 |
| 2 | 锦衣|绮罗|绢帛|绫罗|纱帽|缟素|葛布|褐衣|布衣|绵袍|锦袍|罗衣|罗裳|帛 | 33 |
| 3 | 紫衣|绯衣|青袍|青衫|黄冠|素袍|绣衣|紫袍|绣袂|金冠|紫锦|红罗 | 33 |
| 4 | 赐服|赐紫|赐绯|章服|冠服|朝服|加冠|衮服|衮衣|赐衣|宫衣|方袍|法服|紫衣|紫泥 | 11 |
| 5 | 簪|钗|钿|珰|珥|鱼袋|幞头|佩鱼|金钗|珠佩|银铛|环佩|簮 | 38 |
合计有效行(去重后):约140行含服饰信息
步骤4:过滤噪声
排除以下非服饰用法:
- 襟怀/开襟/冲襟/清襟等→"襟"为胸怀义
- 履冰/履历/步履→"履"非鞋履义
- 白衣人→典故非实指服饰(L3671)
- 冠玉→容貌比喻(L3569)
步骤5:分类整理
最终提取有效服饰片段约80条,分5大类:
- 核心服饰词:约45条
- 材质词:约20条
- 色彩纹饰词:约15条
- 制度词:约8条
- 配饰词:约25条
(部分条目跨类重复计数)
步骤6:审查
- 虚构服饰:0条
- 误读修正:2条(冠玉→容貌比喻,白衣→典故)
- 存疑已标注:1条(铁衣裳→甲胄确认)
关键发现
最有制度史料价值的3条:
- L5665:"朝着重青衫午着绯"——品色服制度
- L2747-2748:"御黄新赐满城看……齐着青衣上戒坛"——僧人服色等级
- L506:"题罢紫衣亲宠锡"——帝王赐僧紫衣制度
最有文学价值的3条:
- L579:"缀裙金蛱蝶挿髻玉鸳鸯角婢红罗缜阉奴紫锦裳"
- L259:"剃髪除须违亲背主形容憔悴衣裳蓝缕"
- L223:"褫龙章之盛饰贸穷岩之襹褐"
全书服饰密度:约1.4%(80条/5898行),以僧服与隐逸服饰为主