《遇恩录》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 任务ID | 22-e |
| 输入文件 | /home/z/my-project/upload/part4/遇恩录.txt |
| 输出目录 | /home/z/my-project/upload/44output/遇恩录/ |
| 执行时间 | 2026-03-05 |
| 文件行数 | 19行(含校刊信息20行) |
提取步骤记录
步骤1:wc -l
19 /home/z/my-project/upload/part4/遇恩录.txt
文件行数少(仅19行),为明代刘仲璟所撰记言体短文,记录洪武二十年至二十四年间朱元璋多次召见功臣后人的圣旨。
步骤2:多轮grep -n
第一轮:核心服饰词
grep -n '服|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'
命中行:3, 5, 9, 10, 11, 13
- 行3:带("带得来"→携带,非腰带,排除)
- 行5:穿("穿的也不少了"→日常穿着,保留)
- 行9:带×2("带将"→带领,排除);锦("锦衣卫"×3→制度机构,保留)
- 行10:带("带几个"→带领,排除);锦("锦衣卫"×1→保留)
- 行11:带×2("带得来"→携带,排除);绣("金绣"→金线刺绣,保留);服("具服"→穿朝服,保留);衣("衣服"→保留)
- 行13:服("服罪"→认罪,排除);冠("冠礼"→加冠之礼,保留)
第二轮:制度词
grep -n '赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'
零命中。本文无制度词直接匹配。
第三轮:装饰词
grep -n '黼黻|文章|纹|绣|织|染|彩|画'
命中行:11("金绣")
第四轮:动作词
grep -n '戴|穿|著|被|披|裹|束|系'
命中行:5("穿"),11("著"→"稍著书子"→"着"之异写,意为"让",非穿着,排除)
步骤3:sed提取片段
对命中行(5, 9, 10, 11, 13)执行上下文提取,因文件仅19行,直接定位精读。
步骤4:甄别与分类
| 原始命中 | 甄别结果 | 分类 |
|---|---|---|
| 行5"穿的" | 有效:日常穿着 | 日常衣著 |
| 行9"锦衣卫"×3 | 有效:制度机构 | 锦衣卫制度 |
| 行10"锦衣卫"×1 | 有效:制度机构 | 锦衣卫制度 |
| 行11"具服" | 有效:穿朝服谢恩 | 赐服礼仪 |
| 行11"金绣衣服" | 有效:核心赐服 | 赐服 |
| 行13"冠礼" | 有效:加冠仪式 | 礼仪服饰 |
| 行13"服罪" | 无效:认罪非服饰 | 排除 |
| 行3/5/9/10/11"带" | 无效:均指"携带" | 排除 |
| 行11"著" | 无效:意为"让" | 排除 |
步骤5:产出3份MD
| 文件名 | 内容 | 大小限制 |
|---|---|---|
| 遇恩录_总结.md | 服饰内容分类总结 | ≤20KB |
| 遇恩录_日志.md | 提取过程日志(本文件) | ≤20KB |
| 遇恩录_原文提取.md | 服饰相关原文摘录 | ≤20KB |
服饰关键词命中统计
| 词类 | 总命中 | 有效命中 | 无效命中 |
|---|---|---|---|
| 核心词 | 14 | 6 | 8 |
| 制度词 | 0 | 0 | 0 |
| 装饰词 | 1 | 1 | 0 |
| 动作词 | 2 | 1 | 1 |
| 合计 | 17 | 8 | 9 |
注意事项
- 本文件篇幅短(19行),服饰信息密度低,仅4条有效服饰内容
- "带"字高频出现但均为"携带"义,非"腰带"义,需逐一排除
- "锦衣卫"属制度机构名,非服饰本体描写,但与明代服饰制度相关,予以保留
- "服罪"中"服"为"认/服从"义,排除
- "冠礼"为仪式名,加冠为核心礼仪动作,与服饰制度直接相关