《清江诗集清江文集》服饰内容提取 · 日志
Task ID: batch-r1-d 书名:清江诗集清江文集 源文件:/home/z/my-project/upload/四库别集/清江诗集清江文集.txt 输出目录:/home/z/my-project/upload/四库别集output/清江诗集清江文集/ 处理时间:2026-03-05
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/清江诗集清江文集/
✅ 成功
Step 2: 查看文件总行数
wc -l 清江诗集清江文集.txt
→ 2104行
Step 3: 五轮grep扫描
| 轮次 | 关键词类别 | 命中行数(含重复) |
|---|---|---|
| R1 | 衣裳袍裘袂襟袖裾袴襦褐衫褂袄 | ~75行 |
| R2 | 冕弁巾帽帻幞头簪笄佩带绅绶笏芾 | ~65行 |
| R3 | 锦绮帛绢绫罗缎绸纱缂缟纨绨绉 | ~45行 |
| R4 | 丝麻葛苎布毡绵染绣黼黻衮 | ~60行 |
| R5 | 履舄靴鞋袜朝服祭服丧服礼服法服戎服常服赐服冠服舆服章服服色衣冠衣裳赐紫赐绯 | ~25行 |
去重后涉及独立行号约70个。
Step 4: sed上下文提取
对约30个关键行号提取前2行后5行上下文,重点验证:
- L17 趿利屣而曵轻裾
- L274 金刀新制衣
- L336 雪色宫衣轻欲举
- L797 马上短衣多楚客城中高髻半淮人
- L1307 狐裘锦祛
- L1381 鹤氅冠銕冠
- L1594 寒无裘暑无葛
- L1866 冠服手板/风裳月佩
✅ 8处关键引文验证通过
Step 5: 非服饰语境过滤
| 过滤类别 | 具体条目 | 原因 |
|---|---|---|
| 丝竹=音乐 | L215"虽无丝与竹" | 丝指弦乐器,非丝织品 |
| 丝=比喻 | L79"断丝弃道边" | 比喻,非丝织品 |
| 绮丽=文风 | L1421"中州之绮丽" | 形容诗文风格,非织物 |
| 锦绣=比喻 | L406"锦绣池台" | 形容建筑华美,非服饰 |
| 锦绣=器物修饰 | L1230"握珠玉被锦绣" | 神像装饰,保留 |
| 裘=人名 | L994"裘仲" | 人名,非服饰 |
| 游丝 | L924"堕地游丝轻复起" | 蜘蛛丝,非丝织品 |
| 黑衣 | L518"黑衣今不至" | 指黑猿,非僧服(注:原诗咏猿) |
| 葛洪=人名 | L509、L511等多处 | 道士人名,非葛布 |
| 丝=蚕丝(保留) | L324"新谷可舂丝可络" | 蚕丝纺织,保留 |
| 裁衣=仙道(保留) | L785"玉女裁衣夜染云" | 道教意象但含服饰制作元素,保留 |
过滤后有效服饰条目:约60条
Step 6: 撰写三份MD
| 文件 | 大小 | 内容 |
|---|---|---|
| 清江诗集清江文集_原文提取.md | ~8KB | 60条服饰原文,按10类分章 |
| 清江诗集清江文集_总结.md | ~7KB | 5大发现+分类综述+对抗式学术审查 |
| 清江诗集清江文集_日志.md | ~4KB | 本文件,操作流程与过滤规则 |
✅ 三份文件均≤20KB
处理统计
- 总行数:2104行
- 五轮grep命中(去重前):约270行
- 去重后涉及独立行号:约70个
- 过滤后有效服饰条目:约60条
- 过滤率:约14%(非服饰条目较少,因本书服饰词汇使用较规范)
核心发现
- "衣冠"高频出现(约12次)——构成元明之际士人身份焦虑的核心修辞,L1230"土木而衣冠/衣冠而土木"为全书最精妙的服饰政治隐喻
- 隐逸服饰谱系完整——从貂裘→青袍→黄冠→一角巾→山叶为衣,映射仕→隐身份降级
- L797"马上短衣多楚客,城中高髻半淮人"——元末社会服饰变动纪实
- L1866《九歌图》题跋——21个人物服饰描写,为元代绘画服饰研究珍贵史料
- L1381"鹤氅冠銕冠"——杨维桢标志性装束的直接记录
日志完。