《西庵集》服饰内容提取 · 工作日志
时间:2026-03-05 任务:提取《西庵集》全部服饰相关内容,整理分类总结
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/西庵集/
Step 2: 获取文件信息
wc -l 西庵集.txt → 1153行
wc -c 西庵集.txt → 163,730字节(约160KB)
Step 3: 查看参考模板
读取三个参考模板:
- 总结.md(吕氏春秋模板)
- 原文提取.md(天工开物模板)
- 日志.md(晋会要模板)
Step 4: 关键词搜索
使用grep -n搜索50+个服饰关键词,统计命中行数:
| 关键词 | 命中行数 | 关键词 | 命中行数 |
|---|---|---|---|
| 衣 | 64 | 带 | 30 |
| 罗 | 52 | 冠 | 19 |
| 佩 | 37 | 裘 | 11 |
| 丝 | 36 | 袂 | 9 |
| 裳 | 15 | 履 | 8 |
| 裙 | 15 | 帽 | 8 |
| 巾 | 14 | 缨 | 8 |
| 锦绣 | 6 | 纱 | 7 |
| 袜 | 6 | 葛 | 6 |
| 麻 | 5 | 袍 | 5 |
合计命中行数:214行(含重叠)
Step 5: 精确搜索
使用核心服饰实体词汇组合搜索,排除纯地名/隐喻用法:
- 织染局、染丝、织成裁衣、蚕妇、白纻、短褐、敝裘、布衣、锦衣
- 冠裳、冠带、冠盖、峨冠博带、缙绅、绮罗、砑罗裙、罗袜
- 乌纱、纱帽、葛巾、渊明巾、华阳巾、羊裘、蓑、氊衫、花布袄
- 战袍、儒衣、朱衣、锦袍、赭黄、袈裟、风氅、霓裳
- 红绢衣、荷丝裙、翠裙、白霓裙、鹔鹴裘、凌波袜
Step 6: 分类整理
按10大类整理:
- 蚕桑丝织(9处)
- 白纻四时词(3首)
- 贫士寒衣(12处)
- 仕宦冠服(14处)
- 女子服饰(16处)
- 巾帽(11处)
- 少数民族服饰(1处)
- 僧道隐逸(9处)
- 军中服饰(3处)
- 帝王服色与典故(5处)
Step 7: 产出三份文件
- 西庵集_原文提取.md(约14KB)——原文片段+行号+简要注释
- 西庵集_总结.md(约6KB)——分类总结+重点分析+统计
- 西庵集_日志.md(本文件)
关键发现
- 作者曾任织染局使:孙蕡洪武三年进士后首任即为工部织染局使,掌管官方丝织染色事务,集中蚕桑丝织描写应有亲身经验。
- 蚕妇词"丝成给日食,不得身上衣":全集中最直击服饰社会矛盾的句子,织者无衣穿。
- 白纻词四首:沿袭六朝乐府传统,以白麻布为服饰主题贯穿四季,在明代别集中较有特色。
- 寒衣意象群:短褐、敝裘、布衣反复出现,反映元末明初士人生存困境。
- 朝云故事(行1119-1120):集中服饰最密集段落,一段文字中出现红绢衣、荷丝裙、翠裙、白练裙、凌波袜、缟衣等6种以上女子服饰。
- 少数民族服饰实录:行314记录黎州、云南地区"披氊衫""花布袄",为罕见的西南边地服饰记载。
- 赭黄仅一处(行443):帝王服色在别集中出现频率极低,符合诗歌创作规律。
关键踩坑记录
- "丝"字36处命中,但大量为"丝管""丝络""如丝"等非服饰用法,需人工筛选。
- "佩"字37处命中,多为"佩鸣珰""环佩"等佩饰,亦有"敬佩"等非服饰用法。
- "罗"字52处命中,约半数为"罗浮"(地名),需严格排除。
- "带"字30处命中,含"地带""连带"等非服饰用法,需逐条甄别。
- 部分诗句中服饰为典故引用(如"鳬舄""南冠""鹔鹴裘"),非写实,但归入典故类仍具参考价值。
审核结果
全部通过 ✅ — 原文均从西庵集.txt中grep+sed提取,有明确行号对应。每篇产出文件均≤20KB。