《西塍集》服饰内容提取 · 操作日志
时间:2026-03-05 任务:提取《西塍集》全部服饰相关内容,整理分类总结 文件:/home/z/my-project/upload/四库别集/西塍集.txt(406行)
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/西塍集/
→ 成功
Step 2: 查看参考模板
读取 /home/z/my-project/upload/参考/ 总结.md、日志.md、原文提取.md
→ 三份模板格式确认
Step 3: 确认源文件基本信息
wc -l 西塍集.txt → 406行
sed -n '1,30p' → 确认为四库全书本,宋宋伯仁撰,提要+三部分诗稿
Step 4: grep检索服饰关键词(第一批)
grep -n '衣|裳|冠|冕|裘|袍|裙|衫|袖|领|带|履|靴|袜|巾|帻|帽|簪|笏|绶|佩|饰|绣|锦|绢|绸|缎|纱|罗|绫|帛|丝|麻|葛|褐|布|蓑|襦|袂|袴' 西塍集.txt
→ 23行命中
Step 5: grep检索首饰装饰关键词(第二批)
grep -n '妆|粉|黛|眉|髻|鬟|钗|环|珥|珰|珠|玉|翠|金|银' 西塍集.txt
→ 补充行131(翠鬟)、行400(画眉/妆饰)等
Step 6: sed提取命中行上下文
对23个命中行号逐一执行 sed -n '$((line-1)),$((line+1))p'
→ 提取每处上下文,确认有效服饰条目
Step 7: 排查误命中(false positive)
| 行号 | 关键词 | 判定 | 原因 |
|---|---|---|---|
| 79 | 鬓丝 | ❌排除 | "鬓丝"指白发,非丝织品 |
| 91 | 一丝风 | ❌排除 | "丝"指细微,非丝线 |
| 127 | 山带雨 | ❌排除 | "带"为动词"带着",非衣带 |
| 150 | 鸡冠 | ❌排除 | 鸡冠花,非冠帽 |
| 190 | 鬓丝 | ❌排除 | 同行79 |
| 272 | 鬓丝 | ❌排除 | 同行79 |
| 291 | 簪杨柳 | ✅保留 | 簪为发饰动作 |
| 324 | 素志 | ❌排除 | "素"指纯洁,非素服 |
经排查,有效服饰条目约15处,涉及15首诗。
Step 8: 查看全书章节结构
grep -n '○' 西塍集.txt
→ 行30: ○嘉熈戊戌家马塍稿
→ 行134: ○嘉熈戊戌夏复游海陵稿
→ 行208: ○嘉熈戊戌已亥马塍稿
Step 9: 分类整理并生成三份文件
按6大类整理:
- 官服冠帽(貂裘/貂蝉/兜鍪/破帽/乌纱/朝靴)
- 蓑衣渔服(青蓑/蓑笠/緑蓑)
- 女性服饰与妆饰(嫁衣/丝绢/翠鬟/绣床/妆饰)
- 僧衣与其他(衲衣/罗衣/夹衣/裙幅)
- 饰物(簪)
- 典故非写实(衣钵/昼锦)
关键发现
- 《西塍集》为江湖诗派小集,服饰内容极少——全书406行,有效服饰条目仅约15处
- 无一系统性服饰制度记载,所有服饰均为诗句中的零星意象
- 蓑衣是最突出的服饰意象,出现3次,均与隐逸田园主题相关
- 嫁衣出现2次,分别见于《村姑》和《老女》,反映南宋底层女性服饰困境
- 官服意象皆含反讽:貂裘→仕途困顿,乌纱→无官可落,朝靴→醉后失态
- 妆饰描写集中见于末篇《佳人歌》,有匀粉、画眉、簪花、绣床等
- 部分关键词为误命中(鬓丝、鸡冠花、山带雨等),需逐条人工甄别
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应。误命中条目已排查排除。