研究总结 日志 原文

《遇恩录》服饰内容提取日志

基本信息

项目 内容
任务ID 22-e
输入文件 /home/z/my-project/upload/part4/遇恩录.txt
输出目录 /home/z/my-project/upload/44output/遇恩录/
执行时间 2026-03-05
文件行数 19行(含校刊信息20行)

提取步骤记录

步骤1:wc -l

19 /home/z/my-project/upload/part4/遇恩录.txt

文件行数少(仅19行),为明代刘仲璟所撰记言体短文,记录洪武二十年至二十四年间朱元璋多次召见功臣后人的圣旨。

步骤2:多轮grep -n

第一轮:核心服饰词

grep -n '服|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'

命中行:3, 5, 9, 10, 11, 13

第二轮:制度词

grep -n '赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'

零命中。本文无制度词直接匹配。

第三轮:装饰词

grep -n '黼黻|文章|纹|绣|织|染|彩|画'

命中行:11("金绣")

第四轮:动作词

grep -n '戴|穿|著|被|披|裹|束|系'

命中行:5("穿"),11("著"→"稍著书子"→"着"之异写,意为"让",非穿着,排除)

步骤3:sed提取片段

对命中行(5, 9, 10, 11, 13)执行上下文提取,因文件仅19行,直接定位精读。

步骤4:甄别与分类

原始命中 甄别结果 分类
行5"穿的" 有效:日常穿着 日常衣著
行9"锦衣卫"×3 有效:制度机构 锦衣卫制度
行10"锦衣卫"×1 有效:制度机构 锦衣卫制度
行11"具服" 有效:穿朝服谢恩 赐服礼仪
行11"金绣衣服" 有效:核心赐服 赐服
行13"冠礼" 有效:加冠仪式 礼仪服饰
行13"服罪" 无效:认罪非服饰 排除
行3/5/9/10/11"带" 无效:均指"携带" 排除
行11"著" 无效:意为"让" 排除

步骤5:产出3份MD

文件名 内容 大小限制
遇恩录_总结.md 服饰内容分类总结 ≤20KB
遇恩录_日志.md 提取过程日志(本文件) ≤20KB
遇恩录_原文提取.md 服饰相关原文摘录 ≤20KB

服饰关键词命中统计

词类 总命中 有效命中 无效命中
核心词 14 6 8
制度词 0 0 0
装饰词 1 1 0
动作词 2 1 1
合计 17 8 9

注意事项

  1. 本文件篇幅短(19行),服饰信息密度低,仅4条有效服饰内容
  2. "带"字高频出现但均为"携带"义,非"腰带"义,需逐一排除
  3. "锦衣卫"属制度机构名,非服饰本体描写,但与明代服饰制度相关,予以保留
  4. "服罪"中"服"为"认/服从"义,排除
  5. "冠礼"为仪式名,加冠为核心礼仪动作,与服饰制度直接相关