《莅蒙平政录》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 任务ID | 14-c |
| 输入文件 | /home/z/my-project/upload/part4/莅蒙平政录.txt |
| 输出目录 | /home/z/my-project/upload/44output/莅蒙平政录/ |
| 处理时间 | 2025年 |
| 文件总行数 | 743行 |
处理流程
第一步:文件概览
wc -l获得总行数743行- 本书为清康熙年间蒙阴知县陈朝君莅任公文汇编
第二步:多轮grep提取
第1轮:制度词+核心词精准匹配
grep -n "服色|舆服|冠服|章服|赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服"
结果:0条命中。本书无服饰制度性内容。
第2轮:核心材质词匹配
grep -n "衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕"
结果:大量命中,但多数为非服饰语境(如"布政司""布置""带领""丝毫无损"等),需人工过滤。
第3轮:装饰词匹配
grep -n "黼黻|文章|纹|绣|织|染|彩|画"
结果:少量命中,多为"文章"(指文章学问)、"织"(络绎如织,比喻)等非服饰用法。
第4轮:动作词匹配
grep -n "服|冠|戴|穿|著|被|衣|披|裹|束|系"
结果:命中极多,绝大多数为非服饰用法("服从""制度""被祸""系指"等)。
第三步:人工筛选与sed上下文提取
经多轮grep筛选,确认以下行含有真正的服饰相关内容:
| 行号 | 服饰关键词 | 内容类别 | 语境摘要 |
|---|---|---|---|
| 25 | 鹑衣、龙衣 | 民贫描写、进运 | 序文概述蒙邑困苦 |
| 32 | 服(服官) | 非服饰 | "服是官者",排除 |
| 134 | 衣里珠 | 佛典比喻 | 留抵钱粮比喻 |
| 139 | 龙衣、织造 | 进运运输 | 驿传五款之请 |
| 216 | 衣服 | 官服典卖 | 禁包揽火耗示 |
| 224 | 衣锦 | 科举比喻 | 设月课示 |
| 244 | 蚕场、放蚕 | 蚕业 | 严查山场 |
| 248 | 蚕场、放蚕 | 蚕业 | 严查遗漏山场 |
| 268 | 蚕(叶尽蚕不老) | 比喻 | 严饬夫役 |
| 306 | 马价全衣 | 进运标题 | 标题行 |
| 310 | 龙衣 | 进运标题 | 标题行 |
| 325 | 龙衣、缎箱、布捆、衣服澣濯、织造、龙衮 | 进运/帝服 | 十大苦之七、八及复旧制 |
| 332 | 衣服澣濯、织造、缎箱、布捆、龙衮 | 进运/帝服 | 五条利弊之五 |
| 339 | 骡缎、茧线、山紬、缎子 | 纺织财物 | 逃人刘云山案 |
| 377 | 上用缎疋、织造 | 进运运输 | 进运无车请夫抬 |
| 395 | 龙袍 | 进运运输 | 龙衣关系最重 |
| 590 | 田蚕 | 农桑 | 厉祭文 |
| 614 | 冠葢 | 官员仪仗 | 元宵油价示 |
第四步:分类整理
将筛选出的服饰内容归纳为四大类:
- 御用服饰与织造运输(龙衣/龙袍、上用缎疋、织造府、衣服澣濯)
- 民间服饰与纺织(鹑衣、蚕场、茧线/山紬/缎子、短衿露肘、衣服典卖)
- 服饰相关意象与比喻(衣里珠、衣锦披云、龙衮)
- 制度性服饰提及(冠葢)
第五步:产出MD文件
- 莅蒙平政录_总结.md:分类总结与史料价值评估
- 莅蒙平政录_日志.md:本文件,处理过程记录
- 莅蒙平政录_原文提取.md:关键原文逐条摘录
去重与排误说明
排除的伪命中
| 关键词 | 伪命中文本 | 排除理由 |
|---|---|---|
| 服 | 服是官者、服从、衣服(已取) | "服"作"担任"义非服饰 |
| 布 | 布政司、布满、公布 | "布"作行政或分布义 |
| 带 | 带领、地带、连带 | "带"作动词或地域义 |
| 织 | 络绎如织、组织 | "织"作比喻或编排义 |
| 文章 | 真文章、文章经济 | "文章"指学问文章 |
| 丝 | 丝毫无损 | "丝"作程度副词 |
| 被 | 被祸、被获 | "被"作被动标记 |
| 系 | 关系、联系、确系 | "系"作"是"义 |
| 裹 | 包裹 | 此处作动词用,无服饰义 |
| 束 | 约束 | 非服饰义 |
确认的有效服饰条目
经严格筛选,共确认 18条 有效服饰相关原文(详见原文提取文件)。
处理统计
| 统计项 | 数值 |
|---|---|
| 总行数 | 743 |
| grep总命中行数(去重前) | 约60行 |
| 有效服饰条目 | 18条 |
| 服饰相关行占比 | 约2.4% |
| 核心服饰段落 | 6段 |