《纯白斋类稿》服饰内容提取 · 工作日志
时间:2026-04-19 任务ID:batch10-4 任务:处理《纯白斋类稿》服饰内容整理
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/纯白斋类稿/
Step 2: 查看参考模板
读取 /home/z/my-project/upload/参考/ 下三个模板:
- 总结.md(吕氏春秋模板,分类归纳式)
- 日志.md(晋会要模板,操作流程记录式)
- 原文提取.md(天工开物模板,按主题逐条提取式)
Step 3: 确认源文件
wc -l 纯白斋类稿.txt → 1837行
全书20卷,赋1卷+诗16卷+杂文3卷,元·胡助撰。
Step 4: grep关键词检索
分4轮搜索,覆盖服饰主要类别:
| 轮次 | 关键词 | 命中行数 |
|---|---|---|
| 第1轮 | 衣、冠、裘、袍、褐、裳、带、佩、履、屦、绶、笏、巾、帽 | ~60行 |
| 第2轮 | 冕、弁、旒、衮、黼、黻、绣、绮、锦、绢、绫、罗、缎、缟、帛 | ~60行 |
| 第3轮 | 禅衣、丧服、祭服、朝服、舆服、服色、章服、深衣等 | ~10行 |
| 第4轮 | 幅巾、野服、道衣、羽衣、衲、袈裟、毡、毳、蓑衣 | ~20行 |
综合统计含服饰关键词的行约233行,但大量为虚指(如"丝桐"指琴、"佩"指佩带等),有效服饰条目约35条。
Step 5: sed提取关键片段
对35条有效条目逐一用 sed -n 'Xp' 提取原文,确认上下文后分类整理。
Step 6: 产出文件
| 文件 | 大小 | 说明 |
|---|---|---|
| 纯白斋类稿_原文提取.md | 8.8KB | 按八大类逐条提取原文 |
| 纯白斋类稿_总结.md | 5.7KB | 分类归纳+核心发现 |
| 纯白斋类稿_日志.md | 本文件 | 操作记录 |
关键发现
- 《纯白斋类稿》无服饰专篇:全书为诗文别集,无舆服志或服饰论说
- 服饰描写高度意象化:衣冠=文明、青衫=卑微、绣衣=御史、幅巾=隐逸
- 最有价值的服饰记录:
- 青衫/青袍的自况(4次),反映元代低级文官的真实服色体验
- "敛以时服"遗嘱,体现儒者反对佛事的态度
- 锦袍团龙赐服,反映元代赐服制度
- 缺乏元代特色:未提及质孙服、辫线袄等蒙古服制,表明作者以汉族传统衣冠体系为书写框架
关键踩坑记录
- "衣冠"出现约20次,但绝大多数为文化符号而非服饰实指,需逐一辨析
- "绣衣"7次均为御史代称(取汉制绣衣直指使),非实指绣花衣服
- "丝"字大量出现但多为"丝桐"(琴)、"丝纶"(诏书)、"蛛丝"等,与纺织无关
- "带"字多为"带雨""带云"等动词用法,非腰带
- "佩"字多为"佩明月""仙佩"等意象,非玉佩实物(仅1处"水苍新玉佩"为实指)
审核结果
全部通过 ✅ — 原文均从四库别集文本grep提取,有明确行号对应。无效命中(虚指、非服饰用法)已剔除。