《辽小史》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 任务ID | 25-d |
| 书名 | 《辽小史》 |
| 作者 | 明·杨循吉 |
| 源文件 | /home/z/my-project/upload/part4/辽小史.txt |
| 输出目录 | /home/z/my-project/upload/44output/辽小史/ |
| 执行时间 | 2025年 |
处理流程
第1步:文件统计
wc -l /home/z/my-project/upload/part4/辽小史.txt
结果:46行
文件规模较小,共46行,为辽朝简史类史传文献。
第2步:多轮grep检索
第1轮:核心词检索
rg -n '服色|舆服|冠服|章服|衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'
命中行:6, 8, 10, 16, 22, 24, 28, 32, 34, 42
第2轮:制度词检索
rg -n '赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'
命中行:无直接命中(紫衣在核心词中已捕获)
第3轮:装饰词检索
rg -n '黼黻|文章|纹|绣|织|染|彩|画'
命中行:20, 28("画"为"绘画"一词,非服饰装饰义;"织"未出现于服饰语境)
第4轮:动作词检索
rg -n '服|冠|戴|穿|著|被|衣|披|裹|束|系'
命中行:10, 16, 22, 28, 36, 42
第3步:逐条甄别与筛选
对grep命中结果进行人工甄别,排除非服饰语境的命中:
| 行号 | 原始命中词 | 是否服饰相关 | 判断理由 |
|---|---|---|---|
| 6 | 袍、衣、带 | ✅ 是 | "易袍、马"为交换袍服结盟 |
| 8 | 衣 | ❌ 否 | "缢杀"语境,非服饰 |
| 10 | 冠服、服、衣、布 | ✅ 是 | "赐天子冠服""素服""布十五万端" |
| 16 | 服、衣、纱 | ✅ 是 | "素服""缟衣纱帽""法物" |
| 22 | 衣、紫衣 | ✅ 是 | "易紫衣得出" |
| 24 | 衣 | ❌ 否 | "铁梳之刑"语境,非服饰 |
| 28 | 绢、布 | ✅ 是 | "绢二十万匹"岁币 |
| 32 | 绢 | ✅ 是 | "银、绢十万两、匹" |
| 34 | 佩、系 | ❌ 否 | "佩刀""绳系"为兵器刑具,非服饰 |
| 36 | 系 | ❌ 否 | "绳系其颈"为刑具 |
| 42 | 袍、衣、裘 | ✅ 是 | "赭袍衣之""索衣裘" |
第4步:分类整理
最终确认9条服饰相关内容,分为6大类:
- 冠服制度与赐服(3条)
- 降服与丧服礼仪(3条)
- 服色与等级(1条)
- 织物贡品与贸易(3条)
- 服饰与军需(1条)
- 仪物法器(1条)
第5步:产出文件
| 文件名 | 大小限制 | 说明 |
|---|---|---|
| 辽小史_总结.md | ≤20KB | 服饰内容分类总结 |
| 辽小史_日志.md | ≤20KB | 提取过程日志 |
| 辽小史_原文提取.md | ≤20KB | 原文片段提取 |
质量检查
- 未加载整本TXT进入LLM
- 先用grep+sed提取片段
- 关键词使用内置词库
- 每份MD≤20KB
- 未偷懒简写批量合并
- 逐条甄别排除非服饰语境