《觚不觚录》服饰提取日志
任务ID:17-a
处理日期:2026-03-05
操作者:rysxguji子Agent
一、任务信息
| 项目 | 内容 |
|---|---|
| 书名 | 觚不觚录 |
| 作者 | (明)王世贞 |
| 输入文件 | /home/z/my-project/upload/part4/觚不觚录.txt |
| 输出目录 | /home/z/my-project/upload/44output/觚不觚录/ |
| 文件总行数 | 62行 |
二、处理流程
步骤1:文件预检
wc -l确认文件62行head -50预览文件结构,确认为标准纯文本格式- 每行一条完整记录,无换行断裂问题
步骤2:多轮grep提取
第一轮:制度词检索
grep -n "服色|舆服|冠服|章服|赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服"
命中行号:4, 10, 12, 46
第二轮:核心名词检索
grep -n "衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸"
命中行号:2, 3, 4, 5, 9, 10, 11, 12, 15, 26, 30, 40, 41, 42, 45, 46, 48, 51, 57, 61
第三轮:材质与装饰词检索
grep -n "丝|布|葛|麻|棉|茧|蚕|黼黻|文章|纹|绣|织|染|彩|画"
命中行号:12, 14, 27, 41, 52, 54, 59, 60
第四轮:动作词检索
grep -n "服|冠|戴|穿|著|被|衣|披|裹|束|系"
命中行号:2, 3, 4, 5, 9, 10, 11, 12, 26, 30, 40, 41, 45, 46, 48, 51, 57, 61
第五轮:补充检索
grep -n "兜鍪|肩舆|轿|伞|旗|靴|巾|帽|骑|马"
grep -n "花红|锦衣|缇帅|吉服|朝服|祭服|常服|公服|戎服|雅服|燕服|直掇|曳撒|程子衣"
补充命中行号:28, 29, 37, 43, 56
步骤3:去重合并与人工筛选
将所有命中行号去重合并,经人工筛选排除误命中(如"文章"指文辞而非服饰纹样、"被"作被动用法等),确定服饰相关行号:
最终确定行号:3, 4, 5, 9, 10, 11, 12, 30, 40, 41, 45, 46, 48, 51, 52, 57
共16行含实质服饰内容。
步骤4:分类整理
按内容性质分为三大类:
- 官服制度与品级服色(6条):行3, 4, 5, 12, 45, 46
- 冠服礼制与僭越(4条):行9, 10, 11, 30
- 民间服饰与风尚变迁(6条):行40, 41, 48, 51, 52, 57
三、输出文件
| 文件名 | 大小 | 内容说明 |
|---|---|---|
| 觚不觚录_总结.md | ≤20KB | 服饰内容分类总结,含分析解读 |
| 觚不觚录_原文提取.md | ≤20KB | 服饰相关原文完整提取,含关键词标注 |
| 觚不觚录_日志.md | ≤20KB | 本文件,处理流程与提取日志 |
四、质量检查
| 检查项 | 结果 |
|---|---|
| 是否加载整本TXT进LLM | 否,仅通过grep+sed提取片段 |
| 服饰关键词是否使用内置词库 | 是,完整使用任务指定词库 |
| 每份MD是否≤20KB | 是 |
| 是否偷懒简写批量合并 | 否,逐条提取并分类标注 |
| 原文提取是否完整 | 是,16条服饰相关段落全部提取 |
| 误命中是否排除 | 是,排除了"文章"(文辞)、"被"(被动)、"冠"(居首)等误命中 |
五、关键发现备注
- 第45条品级腰带用料为明代服饰制度极珍贵的一手资料,详细记载三至七品腰带材质
- 第57条为全书最详尽的服饰形制描述,涉及褶(戎服)、曳撒、程子衣、道袍四种
- 第10条内臣祭服僭越反映了明代宦官权力扩张在服饰上的体现
- 第40条"戴紫阳巾,衣忠静衣"反映了士大夫服饰向民间下移的现象
- "不觚而觚"的感叹在服饰领域表现尤为突出——制度崩坏与偶尔回归并存