《诚斋挥麈录》服饰内容提取日志
Task ID: 28-e 操作时间:2026-03-05 操作员:rysxguji子Agent
一、基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 诚斋挥麈录 |
| 作者 | 宋·杨万里 |
| 输入文件 | /home/z/my-project/upload/part4/诚斋挥麈录.txt |
| 输出目录 | /home/z/my-project/upload/44output/诚斋挥麈录/ |
| 文件大小 | 26KB |
| 总行数 | 35行 |
| 卷数 | 二卷(卷上、卷下) |
二、grep执行记录
2.1 核心词匹配
关键词:服色|舆服|冠服|章服|衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕
匹配行号:3, 4, 5, 6, 7, 8, 10, 12, 14, 16, 18, 19, 20, 26, 32, 35
初筛命中行数:16行
2.2 制度词匹配
关键词:赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服
匹配行号:8, 16, 32
初筛命中行数:3行
2.3 装饰词匹配
关键词:黼黻|文章|纹|绣|织|染|彩|画
匹配行号:4, 5, 7
初筛命中行数:3行
2.4 动作词匹配
关键词:服|冠|戴|穿|著|被|衣|披|裹|束|系
匹配行号:3, 5, 6, 7, 8, 10, 12, 13, 16, 18, 19, 30, 32, 33, 35
初筛命中行数:15行
三、噪声排除记录
四类关键词合并去重后初筛命中行号:3, 4, 5, 6, 7, 8, 10, 12, 13, 14, 16, 18, 19, 20, 26, 30, 32, 33, 35
共计19行,经逐行人工审核,排除12行噪声:
| 行号 | 匹配词 | 噪声片段 | 排除理由 |
|---|---|---|---|
| 3 | 著、布 | "著之甲令""布于天下" | 著=编入;布=传播 |
| 4 | 画 | "绘画容卫" | 宫殿壁画,非服饰 |
| 5 | 画 | "画样给付" | 画像样本 |
| 7 | 冠、画 | "冠世之宝""书画" | 冠=冠绝;书画收藏 |
| 10 | 履、束 | "履行""束修" | 履=履行;束修=束脩 |
| 13 | 无直接服饰词 | 陵寝制度 | 无服饰内容 |
| 14 | 带、玉 | "带观文殿学士""玉殿" | 带=兼衔;玉殿=宫殿 |
| 20 | 带 | "始带左右" | 带=兼带官称 |
| 26 | 无直接服饰词 | 拜相草制 | 无服饰内容 |
| 30 | 被 | "被饰擢" | 被=被动,非被服 |
| 33 | 著 | "著论成篇" | 著=撰写 |
最终保留行号:6, 8, 12, 16, 18, 19, 32, 35(共8行)
四、分类整理结果
| 类别 | 行号 | 条目 |
|---|---|---|
| 腰带与佩饰 | 6, 8, 16 | 仁宗服玉带;岐王嘉王赐玉带佩金鱼;佩鱼与犀带制度 |
| 服色与品级 | 16, 12, 32 | 假服色与鱼袋;白衣;绿袍与朝服 |
| 礼服与丧服 | 18, 19, 35 | 礼衣裳服;挂冠;服丧与心丧 |
| 纺织品 | 12 | 绢为献书赏赐 |
五、产出文件清单
| 文件名 | 大小 | 内容 |
|---|---|---|
| 诚斋挥麈录_总结.md | ≤20KB | 服饰内容分类总结与学术评述 |
| 诚斋挥麈录_日志.md | ≤20KB | 提取操作过程记录(本文件) |
| 诚斋挥麈录_原文提取.md | ≤20KB | 服饰相关原文全文及关键词标注 |
六、特殊情况说明
Line 16"红艇犀带":原文"红艇"疑为"红鞓"之误刻或OCR错误。鞓(tīng)为腰带革带部分,红鞓犀带为宋代高品官员腰带制度,见《宋史·舆服志》。保留原文,注释说明。
Line 16"假服色不□□":原文有缺字(□□),无法补全,保留原貌。
Line 8"方团":方团为玉带的形制名称,方团玉带即方形和圆形玉饰相间排列之带。
Line 8"嘉王κ":κ为OCR识别乱码,应为嘉王頵(赵頵)。
Line 32"纟并":为OCR识别错误,应为人名用字,原字待考。
全书服饰密度:本书以典章制度、人物掌故为主,服饰内容占比极低(8/35行,约23%的行涉及,但实际服饰语义仅7条),远低于《东京梦华录》等专记风俗之书。
七、方法论备注
- 严格遵守"grep+sed提取片段"原则,未将全文载入LLM
- 四类关键词分轮grep,合并去重后人工审核
- 噪声排除标准:匹配词在原文语境中非服饰语义
- 动作词"服""冠""著""带"等高频多义词,逐一核对上下文