《李秀成供状》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 李秀成供状 |
| 源文件 | /home/z/my-project/upload/part3/李秀成供状.txt |
| 输出目录 | /home/z/my-project/upload/33output/李秀成供状/ |
| 源文件行数 | 69行 |
| 源文件字数 | 约32,000字 |
| 提取日期 | 2026-03-04 |
提取流程
第一步:目录创建
mkdir -p /home/z/my-project/upload/33output/李秀成供状/
状态:✅ 完成
第二步:关键词检索
使用grep对全文进行服饰关键词扫描,关键词表如下:
衣裳、裘、冠、冕、弁、佩、带、绶、笏、袍、褐、布、帛、锦、绮、绢、绸、缎、绫、罗、纱、丝、绣、织、染、衮、章服、裙、袄、裤、履、舄、靴、鞋、帽、巾、幞、簪、钗、钿、环、珮、玉、金、银、珠、服色、冠服、舆服、赐服、朝服、公服、常服、丧服、祭服、蟒袍、补子、霞帔、凤冠、深衣、大带、革带、蔽膝、鱼袋、幞头、乌纱、顶戴、花翎、朝珠、铠甲
首轮检索问题:部分高频单字(衣、带、金、银、玉、布、丝等)匹配过多非服饰语境,如"带兵""金银""玉山""布政司"等。
第三步:精炼检索
对首轮结果进行人工筛选,排除以下类型:
- 非服饰用"衣":无("衣服""冬衣""龙袍"均为服饰语境)
- 非服饰用"带":大量("带兵""带领""带人马"等,全部排除)
- 非服饰用"金/银":大量("银两""银钱"为货币非首饰,"金银"多数为财物非服饰配件,仅保留"首饰金银")
- 非服饰用"玉":"玉山"(地名)、"玉玺"(仪制器物,保留)
- 非服饰用"布":"布政司"(官职,排除)
- 非服饰用"丝":无独立服饰用法出现
- 非服饰用"旗":"旗帜"(军旗,保留于织造类)
第四步:命中统计
| 行号 | 关键词 | 命中原文片段 | 有效条目数 |
|---|---|---|---|
| 3 | 衣服 | 将里内之粮食衣服逢村即取 | 1 |
| 5 | 玉玺 | 天王在长沙南门制造玉玺 | 1 |
| 25 | 旗帜 | 在杭州新制造旗帜 | 1 |
| 41 | 衣帽朝服 | 将其衣帽朝服一应归还 | 1 |
| 51 | 冬衣 | 我军未带冬衣 | 1 |
| 55 | 龙袍 | 赐下龙袍 | 1 |
| 62 | 黄缎子、绸缎 | 用黄缎子书大字……并赐绸缎前来 | 2 |
| 62 | 首饰 | 将合家首饰……交十万 / 将母亲及妇女首饰金银 | 2 |
| 64 | 绉纱带、珍珠 | 用绉纱带捆带在身 / 珍珠宝物 | 2 |
汇总:命中行数 8行,有效条目 12条
第五步:分类归档
将12条有效条目按以下分类归档:
- 衣物类(4条):衣服、冬衣、龙袍、衣帽朝服
- 丝织品类(3条):黄缎子、绸缎、绉纱带
- 首饰宝物类(3条):首饰×2、珍珠宝物
- 仪制相关类(2条):旗帜、玉玺
第六步:对抗式审核
审核项1:是否存在过度解读?
- ❌ 无。所有条目均为原文直接出现的服饰相关词汇,未做引申。
- "玉玺"虽非穿戴服饰,但属帝王仪制器物,与"冠服舆服"大类相关,保留。
审核项2:是否存在遗漏?
- ✅ 可能遗漏:全文中"剃发"出现1次(第64行),与发式仪容相关,但因非穿戴服饰,未纳入核心条目。
- ✅ 可能遗漏:"战马"虽为骑乘工具,非服饰,正确排除。
- ✅ 正确排除:"布政司"中"布"非织物义。
审核项3:分类是否合理?
- ✅ "龙袍"归入赐服/帝王服饰,符合太平天国制度语境。
- ✅ "黄缎子"归入皇家丝织品,因黄缎为御用文书载体。
- ✅ "首饰"归入首饰宝物类,非衣物类。
审核项4:数据准确性?
- 命中行数:8行 ✅
- 有效条目数:12条 ✅
- 未命中关键词占比:约85%(70个关键词中仅约15个有命中或部分命中)
产出文件清单
| 文件名 | 大小限制 | 说明 |
|---|---|---|
| 李秀成供状_总结.md | ≤20KB | 服饰信息分类总结与学术分析 |
| 李秀成供状_日志.md | ≤20KB | 提取流程与审核记录 |
| 李秀成供状_原文提取.md | ≤20KB | 命中原文片段完整摘录 |