《野记》服饰提取日志
任务信息
- Task ID: 32-b
- 输入文件:
/home/z/my-project/upload/part4/野记.txt - 输出目录:
/home/z/my-project/upload/44output/野记/ - 执行时间: 2025年
步骤记录
步骤1:wc -l 检查文件行数
- 命令:
wc -l 野记.txt - 结果:808行
- 文件为明代笔记,篇幅适中,可采用多轮grep+sed方案。
步骤2:多轮grep -n 提取服饰关键词
第1轮:核心词grep
- 命令:
rg -n '服色|舆服|冠服|章服|衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕' 野记.txt - 命中行数:约100行(含大量泛用词"衣""服"等)
第2轮:制度词grep
- 命令:
rg -n '赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服' 野记.txt - 命中行数:4行(行254、342、604、664)
第3轮:装饰词grep
- 命令:
rg -n '黼黻|文章|纹|绣|织|染|彩|画' 野记.txt - 命中行数:约60行("文章""彩""画"等泛用词较多)
第4轮:动作词grep
- 命令:
rg -n '服|冠|戴|穿|著|被|衣|披|裹|束|系' 野记.txt - 命中行数:92行(泛用动词极多,需人工筛选)
第5轮:精准词grep
- 命令:
rg -n '服色|尚赤|冠带|巾|帽|头巾|平定巾|软巾|纱罗|漆布|命服|青袍|蓝衣|青衣|绯袍|玉带|金带|章服|红袍|绣囊|锦绣|缯彩|吏巾|绦|冠袍|野服|草衣|银黄|牙牌' 野记.txt - 命中行数:约30行,精准度大幅提升
步骤3:sed提取原文片段
- 提取行号列表:22, 28, 30, 38, 106, 108, 122, 124, 138, 170, 178, 254, 308, 310, 324, 342, 370, 478, 500, 584, 586, 600, 604, 620, 626, 662, 664, 680, 694, 710
- 共计30行
- 提取内容总大小:约25KB
步骤4:分类整理
按内容性质分为7大类:
- 服饰制度类(行106, 108, 122, 124, 662)——5条
- 品服赐服类(行254, 342, 604, 626, 664)——5条
- 特殊服饰类(行22, 28, 30, 138, 370, 584, 586, 600)——8条
- 卤簿仪仗类(行680)——1条(篇幅极大)
- 纺织工艺类(行38, 694)——2条
- 人物服饰类(行170, 178, 308, 310, 324, 478, 500)——7条
- 服饰罚典类(行710)——1条
- 妓女服饰类(行620)——1条
步骤5:产出MD文件
- 野记_总结.md:分类总结,约8KB
- 野记_日志.md:本文件,处理日志
- 野记_原文提取.md:按类别收录原文片段,约18KB
关键词命中统计
| 类别 | 关键词 | 命中条目数 |
|---|---|---|
| 核心词 | 服色、衣、冠、袍、巾、帛等 | 100+行(筛选后30条) |
| 制度词 | 赐绯、绯袍、玉带、金带 | 4行 |
| 装饰词 | 绣、织、彩、纹 | 60行(筛选后8条) |
| 动作词 | 服、冠、戴、著、被 | 92行(筛选后15条) |
| 精准词 | 平定巾、尚赤、冠带、吏巾等 | 30行 |
数据质量评估
- 《野记》为明代综合性笔记,非专述舆服之书,服饰记载散见于各条掌故中。
- 核心价值条目:四方平定巾制度(行106)、服色尚赤(行122)、监生青袍变迁(行662)、赐绯制度(行254/626)、大驾卤簿(行680)。
- 部分条目服饰仅为辅助描写(如"公服危坐""草衣"等),但亦具参考价值。
- 行680卤簿仪仗为全书最长服饰相关条目,详细记载大驾仪仗器物。