华亭百咏 服饰提取处理日志
书名: 华亭百咏
作者: 宋·许尚
处理时间: 2026-05-09
一、处理流程
- 源文件:
/home/z/my-project/upload/四库别集/华亭百咏.txt
- 输出目录:
/home/z/my-project/upload/四库别集output/华亭百咏/
- 总行数: 481
五轮grep统计
| 轮次 |
关键词类别 |
命中行数 |
| R1 |
衣裳袍裘 |
0 |
| R2 |
冠冕弁巾 |
4 |
| R3 |
锦绮帛绢 |
2 |
| R4 |
丝麻葛布 |
0 |
| R5 |
履舄靴鞋制度词 |
1 |
| 合计(去重) |
|
7 |
语境过滤
- sed提取关键行上下文(前2行后5行)
- 过滤非服饰语境:冠盖、冠绝、绵州、布政、罗浮、丝竹、绮窗等
- 甄别后有效服饰条目: 4条
二、输出文件
| 文件 |
大小 |
内容 |
| 华亭百咏_原文提取.md |
≤20KB |
原文片段,按5类分章 |
| 华亭百咏_总结.md |
≤20KB |
分类分析+核心发现+学术价值+对抗式审查 |
| 华亭百咏_日志.md |
≤20KB |
处理过程记录 |
三、核心发现
- 全书仅4条有效服饰条目,均为典故用词
- 簪→儒冠→星冠构成儒→释→道身份转换链
- 凫舄为县令代称
- 服饰内容极少,以文学意象为主
四、验证
- 五轮grep覆盖率: 7/481行(1.5%)
- 3份MD均≤20KB ✓