研究总结 日志 原文

《西塍集》服饰内容提取 · 操作日志

时间:2026-03-05 任务:提取《西塍集》全部服饰相关内容,整理分类总结 文件:/home/z/my-project/upload/四库别集/西塍集.txt(406行)


操作流程

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/西塍集/
→ 成功

Step 2: 查看参考模板

读取 /home/z/my-project/upload/参考/ 总结.md、日志.md、原文提取.md
→ 三份模板格式确认

Step 3: 确认源文件基本信息

wc -l 西塍集.txt → 406行
sed -n '1,30p' → 确认为四库全书本,宋宋伯仁撰,提要+三部分诗稿

Step 4: grep检索服饰关键词(第一批)

grep -n '衣|裳|冠|冕|裘|袍|裙|衫|袖|领|带|履|靴|袜|巾|帻|帽|簪|笏|绶|佩|饰|绣|锦|绢|绸|缎|纱|罗|绫|帛|丝|麻|葛|褐|布|蓑|襦|袂|袴' 西塍集.txt
→ 23行命中

Step 5: grep检索首饰装饰关键词(第二批)

grep -n '妆|粉|黛|眉|髻|鬟|钗|环|珥|珰|珠|玉|翠|金|银' 西塍集.txt
→ 补充行131(翠鬟)、行400(画眉/妆饰)等

Step 6: sed提取命中行上下文

对23个命中行号逐一执行 sed -n '$((line-1)),$((line+1))p'
→ 提取每处上下文,确认有效服饰条目

Step 7: 排查误命中(false positive)

行号 关键词 判定 原因
79 鬓丝 ❌排除 "鬓丝"指白发,非丝织品
91 一丝风 ❌排除 "丝"指细微,非丝线
127 山带雨 ❌排除 "带"为动词"带着",非衣带
150 鸡冠 ❌排除 鸡冠花,非冠帽
190 鬓丝 ❌排除 同行79
272 鬓丝 ❌排除 同行79
291 簪杨柳 ✅保留 簪为发饰动作
324 素志 ❌排除 "素"指纯洁,非素服

经排查,有效服饰条目约15处,涉及15首诗。

Step 8: 查看全书章节结构

grep -n '○' 西塍集.txt
→ 行30: ○嘉熈戊戌家马塍稿
→ 行134: ○嘉熈戊戌夏复游海陵稿
→ 行208: ○嘉熈戊戌已亥马塍稿

Step 9: 分类整理并生成三份文件

按6大类整理:

  1. 官服冠帽(貂裘/貂蝉/兜鍪/破帽/乌纱/朝靴)
  2. 蓑衣渔服(青蓑/蓑笠/緑蓑)
  3. 女性服饰与妆饰(嫁衣/丝绢/翠鬟/绣床/妆饰)
  4. 僧衣与其他(衲衣/罗衣/夹衣/裙幅)
  5. 饰物(簪)
  6. 典故非写实(衣钵/昼锦)

关键发现

  1. 《西塍集》为江湖诗派小集,服饰内容极少——全书406行,有效服饰条目仅约15处
  2. 无一系统性服饰制度记载,所有服饰均为诗句中的零星意象
  3. 蓑衣是最突出的服饰意象,出现3次,均与隐逸田园主题相关
  4. 嫁衣出现2次,分别见于《村姑》和《老女》,反映南宋底层女性服饰困境
  5. 官服意象皆含反讽:貂裘→仕途困顿,乌纱→无官可落,朝靴→醉后失态
  6. 妆饰描写集中见于末篇《佳人歌》,有匀粉、画眉、簪花、绣床等
  7. 部分关键词为误命中(鬓丝、鸡冠花、山带雨等),需逐条人工甄别

审核结果

全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应。误命中条目已排查排除。