《与舍弟书十六通》服饰提取操作日志
基本信息
| 项目 | 内容 |
|---|---|
| 输入文件 | /home/z/my-project/upload/11111/part1/与舍弟书十六通.txt |
| 文件大小 | 30,727 字节 |
| 文件行数 | 55 行 |
| 输出目录 | /home/z/my-project/upload/11output/与舍弟书十六通/ |
| 操作时间 | 2026-03-04 |
操作流程
步骤1:验证输入
- 确认输入文件存在
- 获取文件基本信息:55行,30,727字节
- 确认输出目录已存在(含历史产出,将覆盖)
步骤2:10轮关键词grep
| 轮次 | 关键词 | 命中行数 | 命中行号 |
|---|---|---|---|
| 1 | 衣/裳/服/冠/冕/弁/袍/裘 | 4行 | 13, 30, 32, 38, 42 |
| 2 | 巾/帽/帻/幞头/簪/缨 | 1行 | 46 |
| 3 | 帛/绢/绫/罗/绸/缎/锦/绮/丝/麻/葛/褐 | 7行 | 9, 13, 15, 27, 30, 32, 40, 42, 44, 46, 54 |
| 4 | 佩/笏/带/绶/鱼袋/玺/印 | 1行 | 4 |
| 5 | 履/舄/鞋/靴/袜 | 2行 | 11, 42 |
| 6 | 舆服/服色/赐服/章服/冠服/品服/朝服/公服/祭服/丧服 | 0行 | — |
| 7 | 绣/纹/黼/黻/章/染/织 | 6行 | 4, 15, 23, 30, 32, 42, 51, 52 |
| 8 | 裙/衫/袄/褐/帔/褙子/深衣/襕衫 | 0行 | — |
| 9 | 进贤冠/武冠/貂蝉/笼巾/额子 | 0行 | — |
| 10 | 衮/襦/裆/裈/袴/褶/裾/袂/衿/衽/领/袖/襟 | 1行 | 51 |
合计去重命中行:约13行(含大量误报)
步骤3:人工筛除误报
| 行号 | 关键词 | 误报原因 | 处理 |
|---|---|---|---|
| 4 | 带 | "含讥带讪"中"带"为动词 | 排除 |
| 11 | 履 | "履中国土"中"履"为动词 | 排除 |
| 15 | 章 | "表章"中"章"为"篇章"义 | 排除 |
| 23 | 织 | "组织"类语境,无纺织义 | 排除 |
| 32 | 冠 | "冠绝一时"中"冠"为动词 | 排除 |
| 32 | 章 | "八哀诗"等语境,非章服 | 排除 |
| 40 | 实 | "五谷花实",无服饰义 | 排除 |
| 42 | 织 | "复制为难","复"为"再"义 | 排除 |
| 51 | 领 | "领异"中"领"为"引领"义 | 排除 |
| 51 | 裒 | 无,实为"制艺"等无关内容 | 排除 |
| 52 | 织 | 无纺织义 | 排除 |
| 54 | 丝 | "枯木竹石"无丝织义 | 排除 |
| 9 | 皂 | "皂隶"为贱役称谓,非服饰 | 排除 |
筛后保留行:13, 27, 30, 38, 42, 44, 46(共7行,8处服饰信息点)
步骤4:sed上下文提取
对7个命中行执行sed提取,核验上下文:
sed -n '13p'→ 宫锦袍上下文确认sed -n '27p'→ 执玉帛上下文确认sed -n '30p'→ 织女衣之源 + 织绸织布上下文确认sed -n '38p'→ 披衣上下文确认sed -n '42p'→ 衣服/鞋袜上下文确认sed -n '44p'→ 卖新丝上下文确认sed -n '46p'→ 罗绮/巾上下文确认
步骤5:产出MD文件
| 文件 | 状态 | 内容 |
|---|---|---|
| 与舍弟书十六通_原文提取.md | ✓ | 7处原文片段+注释+误报排除表 |
| 与舍弟书十六通_总结.md | ✓ | 结构化综述+分类表+对抗式审查4条 |
| 与舍弟书十六通_日志.md | ✓ | 本文件,完整操作记录 |
关键统计
| 指标 | 数值 |
|---|---|
| 全文行数 | 55 |
| grep命中行(去重) | 13 |
| 确认服饰相关行 | 7 |
| 服饰信息点 | 8 |
| 误报排除行 | 10+ |
| 第6轮(服制词)命中 | 0 |
| 第8轮(衣制词)命中 | 0 |
| 第9轮(冠帽词)命中 | 0 |
| 服饰信息密度 | 极低(7/55=12.7%行含服饰词,但有效信息仅8处) |