研究总结 日志 原文

《云中事记》服饰内容提取 · 工作日志

时间:2026-04-18 任务:提取《云中事记》全部服饰相关内容,整理分类总结 操作人:自动化流程


操作流程

Step 1: 读取源文件

文件:/home/z/my-project/upload/11111/part1/云中事记.txt
行数:14行(含空行)
字数:约3000字
内容:明·苏祐撰,记述嘉靖癸巳大同兵变始末

Step 2: grep关键词检索

关键词词库(72个):
衣裳裘冠冕弁帻巾帽履舄靴袜带绶佩笏袍袄褂衫裙裈褐褛
锦绮帛绢绫罗缎绸纱缂丝绵貂狐羔葛麻苎毡绒
服色舆服冠服章服赐服赐紫赐绯赐衣鱼袋幞头补服品色
衮深衣朝服祭服丧服吉服常服便服戎服甲铠旒旌旗车服卤簿
服饰衣冠衣裳佩玉纩黼黻文绣染色蚕桑织缫纺绣

初步命中:
【衣】→ 1次(第6行:"治衣装")
【罗】→ 1次(第9行:"罗峰")
【服】→ 2次(第4行:"不服";第12行:"服辩")

Step 3: 逐条审核去噪音

第6行 "治衣装" → ✅ 真命中,"衣装"=衣裳+行装
第9行 "罗峰"  → ❌ 伪命中,"罗峰"为人名
第4行 "不服"  → ❌ 伪命中,"服"=服从/认罪
第12行 "服辩" → ❌ 伪命中,"服辩"=认罪供状(法律术语)

Step 4: 对抗式学术审查

审查1:"治衣装"是否真属服饰范畴?
  → 是。"衣"指衣裳,"装"指行装/装备,"治衣装"即整理衣装
  → 古籍中"衣装"常见于军旅语境,如《汉书》"治衣装待发"
  → 保留

审查2:"罗峰"是否可解读为丝织品"罗"?
  → 否。上下文"罗峰见余诸奏,每语人曰:御史当大用"
  → "罗峰"显然为人名字号,全句语义通顺
  → 排除

审查3:"服辩"是否涉及服饰?
  → 否。"服辩"是明清司法术语,指犯人认罪的供述文书
  → 上下文"审诸服辩,驱之市,日中而戮之"——审讯供状后处决
  → 排除

审查4:是否遗漏了隐含服饰内容?
  → 通读全文14行,未发现任何未命中词库的服饰相关内容
  → 全书为兵变纪实,无舆服、冠服、章服等制度性内容
  → 确认无遗漏

Step 5: 分类整理

有效提取:1条
  - 军士衣装(第6行):领粮饷者求假一日治衣装

噪音排除:3条
  - "罗峰":人名
  - "不服":动词
  - "服辩":法律术语

Step 6: 保存三份文件

/home/z/my-project/upload/11output/云中事记/云中事记_总结.md
/home/z/my-project/upload/11output/云中事记/云中事记_日志.md(本文件)
/home/z/my-project/upload/11output/云中事记/云中事记_原文提取.md

关键发现

  1. 《云中事记》服饰内容极稀:全书约3000字,仅1处与服饰直接相关的原文
  2. "治衣装"为兵变导火索:军士求假整理衣装被拒,是兵变的直接起因之一,折射明中期边镇军士生活保障问题
  3. 噪音比例高:初步命中4处,去噪后仅1处有效,伪命中率75%
  4. 本书性质决定服饰空白:兵变纪实体裁,不涉及服制、舆服、礼仪等制度性服饰内容

关键踩坑记录


审核结果

全部通过 ✅ — 原文从TXT全文grep提取,经逐条审核去噪,仅保留1条确凿服饰内容。