《云中事记》服饰内容提取 · 工作日志
时间:2026-04-18 任务:提取《云中事记》全部服饰相关内容,整理分类总结 操作人:自动化流程
操作流程
Step 1: 读取源文件
文件:/home/z/my-project/upload/11111/part1/云中事记.txt
行数:14行(含空行)
字数:约3000字
内容:明·苏祐撰,记述嘉靖癸巳大同兵变始末
Step 2: grep关键词检索
关键词词库(72个):
衣裳裘冠冕弁帻巾帽履舄靴袜带绶佩笏袍袄褂衫裙裈褐褛
锦绮帛绢绫罗缎绸纱缂丝绵貂狐羔葛麻苎毡绒
服色舆服冠服章服赐服赐紫赐绯赐衣鱼袋幞头补服品色
衮深衣朝服祭服丧服吉服常服便服戎服甲铠旒旌旗车服卤簿
服饰衣冠衣裳佩玉纩黼黻文绣染色蚕桑织缫纺绣
初步命中:
【衣】→ 1次(第6行:"治衣装")
【罗】→ 1次(第9行:"罗峰")
【服】→ 2次(第4行:"不服";第12行:"服辩")
Step 3: 逐条审核去噪音
第6行 "治衣装" → ✅ 真命中,"衣装"=衣裳+行装
第9行 "罗峰" → ❌ 伪命中,"罗峰"为人名
第4行 "不服" → ❌ 伪命中,"服"=服从/认罪
第12行 "服辩" → ❌ 伪命中,"服辩"=认罪供状(法律术语)
Step 4: 对抗式学术审查
审查1:"治衣装"是否真属服饰范畴?
→ 是。"衣"指衣裳,"装"指行装/装备,"治衣装"即整理衣装
→ 古籍中"衣装"常见于军旅语境,如《汉书》"治衣装待发"
→ 保留
审查2:"罗峰"是否可解读为丝织品"罗"?
→ 否。上下文"罗峰见余诸奏,每语人曰:御史当大用"
→ "罗峰"显然为人名字号,全句语义通顺
→ 排除
审查3:"服辩"是否涉及服饰?
→ 否。"服辩"是明清司法术语,指犯人认罪的供述文书
→ 上下文"审诸服辩,驱之市,日中而戮之"——审讯供状后处决
→ 排除
审查4:是否遗漏了隐含服饰内容?
→ 通读全文14行,未发现任何未命中词库的服饰相关内容
→ 全书为兵变纪实,无舆服、冠服、章服等制度性内容
→ 确认无遗漏
Step 5: 分类整理
有效提取:1条
- 军士衣装(第6行):领粮饷者求假一日治衣装
噪音排除:3条
- "罗峰":人名
- "不服":动词
- "服辩":法律术语
Step 6: 保存三份文件
/home/z/my-project/upload/11output/云中事记/云中事记_总结.md
/home/z/my-project/upload/11output/云中事记/云中事记_日志.md(本文件)
/home/z/my-project/upload/11output/云中事记/云中事记_原文提取.md
关键发现
- 《云中事记》服饰内容极稀:全书约3000字,仅1处与服饰直接相关的原文
- "治衣装"为兵变导火索:军士求假整理衣装被拒,是兵变的直接起因之一,折射明中期边镇军士生活保障问题
- 噪音比例高:初步命中4处,去噪后仅1处有效,伪命中率75%
- 本书性质决定服饰空白:兵变纪实体裁,不涉及服制、舆服、礼仪等制度性服饰内容
关键踩坑记录
- "罗峰"极容易误判:作为人名出现,若无上下文审核,会被误收入丝织品类
- "服辩"为法律术语:非服饰研究范围内"服"字,需熟悉明清司法用语方可排除
- "不服"为常见伪命中:动词用法极为普遍,需逐条审核语境
审核结果
全部通过 ✅ — 原文从TXT全文grep提取,经逐条审核去噪,仅保留1条确凿服饰内容。