研究总结 日志 原文

《蜀燹死事者略传》服饰内容提取日志

基本信息

项目 内容
文件路径 /home/z/my-project/upload/part4/蜀燹死事者略传.txt
总行数 403行
输出目录 /home/z/my-project/upload/44output/蜀燹死事者略传/
处理日期 2026-03-04

处理步骤记录

第1步:文件概览

第2步:多轮grep提取

第1轮:制度词与核心复合词

关键词:服色|舆服|冠服|章服|赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服
命中行:7(冠服)

第2轮:核心单字词

关键词:衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕
命中行:7, 11, 17, 23, 29, 31, 33, 37, 41, 49, 53, 57, 61, 65, 69, 75, 81, 85, 89, 99, 105, 119, 127, 131, 143, 147, 153, 161, 167, 177, 181, 187, 195, 201, 203, 207, 215, 235, 259, 261, 393

注意:大量命中为非服饰语境(如人名含"衣"、地名含"带"、虚词"被"等),需逐一筛除。

第3轮:装饰词

关键词:黼黻|文章|纹|绣|织|染|彩|画
命中行:7, 261, 203, 235
其中有效:
- 行261 "织屦为业"(织鞋为业)
- 行203 "卖画课徒"(非服饰画)
- 行235 "能诗工画"(非服饰画)

第4轮:动作词

关键词:服|冠|戴|穿|著|被|衣|披|裹|束|系
命中行:7, 11, 17, 19, 23, 29, 31, 33, 37, 41, 49, 53, 57, 61, 65, 69, 75, 79, 81, 85, 89, 91, 99, 105, 107, 111, 115, 119, 121, 125, 127, 131, 137, 139, 143, 147, 151, 153, 157, 161, 167, 177, 181, 187, 189, 191, 195, 201, 203, 207, 215, 235, 259, 261, 393

注意:动作词命中量极大,大量为虚词"被"(被动语态)、"服"(服毒/佩服)、"系"(系属/关系)等非服饰语境,需严格筛选。

第3步:sed提取关键段落

对筛选后的有效行号,使用 sed -n 'X,Yp' 提取上下文段落:

提取范围 人物/事件 服饰关键词
行5-9 武来雨 冠服
行35-43 张万禄 掷冠、战袍
行49-51 孔吏目/雅安守城 棉絮、血衣
行53-57 井研守城/肃庆 血衣、顶带、葛根之绳
行83-91 王镇、熊绍伊 裤褶、衣冠
行95-103 占泰 绵履、衣冠、扣带
行119-123 黄纯熙 布裹
行129-135 李曾白 朝服、帛
行141-145 陈翼 布帛、袭襟裹首
行165-169 多隆阿 身无完衣
行189-195 洪雅城诗 衣无全
行195-207 赵尔治/庾贵 撩衣、衣我衣屦我履
行257-263 高尚洪 织屦、著短衣、佩短刀

第4步:筛除无效命中

以下命中经审查为非服饰语境,予以排除:

行号 原文片段 排除理由
行11 "李逆名永和"等 "衣"字未出现于服饰语境
行17 "马陷水田" 无服饰内容
行33 "保升六品蓝翎回任" "蓝翎"为官衔而非具体服饰描写
行65 "以云骑尉世职" "骑"非服饰
行69 "权冕宁篆" "冕"为地名(冕宁),非服饰
行79 "伛偻迎劳" 无服饰内容
行147 "杨公讳钅荣" 无服饰内容
行393 "骆公讳秉章" "赏戴花翎""赏戴双眼花翎"等为官衔表述,非具体服饰描写场景

第5步:分类整理

将有效服饰信息分为六大类:

  1. 官服礼制类(4条)
  2. 军戎服饰类(5条)
  3. 丧殓服饰类(4条)
  4. 服饰物品与材料类(6条)
  5. 服饰动作类(5条)
  6. 民生服饰类(2条)

第6步:产出文件

文件名 大小限制 内容
蜀燹死事者略传_总结.md ≤20KB 分类总结、分析
蜀燹死事者略传_日志.md ≤20KB 处理步骤与筛选记录
蜀燹死事者略传_原文提取.md ≤20KB 原文段落全文

关键词命中统计

词类 命中行数 有效行数 有效率
制度词 1 1 100%
核心词 41 15 36.6%
装饰词 4 1 25%
动作词 55 12 21.8%

总计:从101行原始命中中筛出26条有效服饰信息。

备注