《金銮密记》服饰提取工作日志
任务信息
| 项目 | 内容 |
|---|---|
| Task ID | 31-e |
| 输入文件 | /home/z/my-project/upload/part4/金銮密记.txt |
| 输出目录 | /home/z/my-project/upload/44output/金銮密记/ |
| 执行时间 | 2026-03-04 |
执行步骤记录
Step 1:wc -l 统计
35 /home/z/my-project/upload/part4/金銮密记.txt
文件仅35行,属短篇文献。
Step 2:多轮 grep -n 关键词检索
2.1 核心词检索
rg -n '服色|舆服|冠服|章服|衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'
命中行:第5行(冠、珮)、第11行(麻制)、第17行(白麻)、第35行(锦绣)
2.2 制度词检索
rg -n '赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'
命中行:无
2.3 装饰词检索
rg -n '黼黻|文章|纹|绣|织|染|彩|画'
命中行:无
2.4 动作词检索
rg -n '服|冠|戴|穿|著|被|衣|披|裹|束|系'
命中行:第5行(冠)— 已在核心词中覆盖
2.5 补充检索
rg -n '冠|珮|佩|带|巾|帽|簪|钗' → 第5行
rg -n '茶|贡|赐|赏' → 第31行(赐成象殿茶)— 赐茶非赐服
rg -n '金|银|玉|珠' → 第5行(籝金、金门)— 非服饰用金
Step 3:sed 提取关键行
sed -n '5p' # 提取唯一有效服饰行
Step 4:分类与辨析
| 原始匹配 | 甄别结果 | 理由 |
|---|---|---|
| 第5行 峨冠 | ✅ 有效 | 冠服类,朝冠 |
| 第5行 振珮 | ✅ 有效 | 佩饰类,朝佩 |
| 第11行 麻制 | ❌ 排除 | 制书(诏令),非织物 |
| 第17行 白麻 | ❌ 排除 | 白麻纸制书,非布料 |
| 第35行 锦绣 | ❌ 排除 | 书名《锦绣万花谷后集》 |
| 第31行 赐茶 | ❌ 排除 | 赐茶非赐服 |
| 第5行 籝金 | ❌ 排除 | 指籝金(书箱黄金),非金饰 |
| 第5行 金门 | ❌ 排除 | 指金马门(翰林院代称),非金属服饰 |
Step 5:产出3个MD文件
金銮密记_总结.md← 总结报告金銮密记_日志.md← 本文件金銮密记_原文提取.md← 原文提取
文件大小检查
所有产出文件均 ≤ 20KB。
方法论备注
- 严格执行"先grep+sed提取片段"流程,未将整本TXT加载进LLM
- 对"麻""锦""绣""金""赐"等高频多义词逐一人工甄别
- 区分了"白麻制书"(诏令文书)与"麻布"(织物材质)
- 区分了书名用字与织物描述