《三家世典》服饰提取日志
基本信息
- 源文件:/home/z/my-project/upload/11111/part1/三家世典.txt
- 文件规模:129行,85,568字节
- 输出目录:/home/z/my-project/upload/11output/三家世典/
提取过程
第一阶段:多轮关键词grep
采用10轮关键词词库,逐轮grep -n提取命中行号,覆盖服饰各品类。
| 轮次 | 关键词 | 命中行数 | 有效服饰命中 |
|---|---|---|---|
| 第1轮 | 衣、裳、服、冠、冕、弁、袍、裘 | 衣(6行)、服(3行)、袍(2行) | 衣/服/袍均有有效命中 |
| 第2轮 | 巾、帽、帻、幞头、簪、缨 | 0 | 无命中 |
| 第3轮 | 帛、绢、绫、罗、绸、缎、锦、绮、丝、麻、葛、褐 | 帛(4行)、锦(4行)、绮(1行) | 帛/绮有有效命中;锦均为"锦衣卫"官职名 |
| 第4轮 | 佩、笏、带、绶、鱼袋、玺、印 | 带(4行)、玺(2行)、印(6行) | 带/玉带有效;玺/印为印章,排除 |
| 第5轮 | 履、舄、鞋、靴、袜 | 履(1行) | "履贯"为人名用字,非服饰,排除 |
| 第6轮 | 舆服、服色、赐服、章服、冠服、品服等 | 冠服(1行) | "革冠服"有效 |
| 第7轮 | 绣、纹、黼、黻、章、染、织 | 0 | 无有效服饰命中 |
| 第8轮 | 裙、衫、袄、帔、褙子、深衣、襕衫 | 0 | 无命中 |
| 第9轮 | 进贤冠、武冠、貂蝉、笼巾、额子 | 0 | 无命中 |
| 第10轮 | 衮、襦、裆、裈、袴、褶、裾、袂、衿、衽、领、袖、襟 | 领(4行)、襟(1行) | 领/襟均为"统领""襟喉"非服饰义,排除 |
第二阶段:噪音剔除
| 原始命中 | 判定 | 剔除理由 |
|---|---|---|
| 锦衣卫指挥佥事/使 | 排除 | 官署职衔,非服饰 |
| 玉印/玉玺/银印/金印 | 排除 | 印章信物,非服饰 |
| "布衣"(郭英自谓) | 排除 | 比喻"平民",非实指衣物 |
| "尺帛不敢私" | 保留 | 帛为丝织品,此条反映赏赐织物的管理 |
| "襟喉"(江阴襟喉) | 排除 | 地理比喻,非服饰 |
| "统领/领兵" | 排除 | 动词用法,非衣领 |
| "领/领袖"人名 | 排除 | 非服饰 |
| "更衣"(沐浴更衣) | 保留 | 丧仪更衣,属服饰礼仪 |
| "冠带"(照例冠带) | 保留 | 品官冠带制度 |
| "文彩百疋" | 保留 | 丝织品赏赉 |
第三阶段:有效片段汇总
经筛选,共得有效服饰相关片段8处:
- 第23段:赐徐达"文币五十表里"
- 第24段:赐徐达"文绮及帛一百疋"、仪仗户二十家
- 第38段:赐沐英"文彩百疋"
- 第46段:太祖解赤战袍衣郭英
- 第48段:赐郭英"金龙衣一袭"
- 第52段:赐郭英"彩帛四十疋"
- 第82段:吴渊"坐事革冠服"
- 第90段:耿炳文"衣服器皿有龙凤饰,玉带用红鞓"
- 第41段:沐淙母奏请"照例冠带"
- 第113段:杨氏"沐浴更衣,自经死"
第四阶段:分类整理
按服饰学术分类归为5类:
- 赐服赏赉类(4处)
- 御赐战袍类(2处,同事件两版)
- 僭越服饰案(1处)
- 冠服制度相关(2处)
- 丧仪更衣(1处)
数据统计
- 全书总行数:129行
- 10轮grep总命中行数:约40行(含重复)
- 去重后独立命中行数:约25行
- 去噪音后有效服饰行数:10行
- 有效服饰片段数:8处(合并同事件两版后)
方法说明
- 严格使用grep逐关键词提取,不加载全文入上下文
- 命中行人工判读,区分服饰义/非服饰义
- 官职名含服饰字(如"锦衣卫")一律排除
- 比喻义(如"布衣""襟喉")一律排除
- 仅保留确属服饰或与服制直接相关的内容