《竹素山房诗集》服饰内容提取 · 工作日志
时间:2026-04-19 任务ID:batch6-5 任务:提取《竹素山房诗集》全部服饰相关内容,整理分类总结
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/竹素山房诗集/
Step 2: 文件基本信息
wc -l 竹素山房诗集.txt → 734行
Step 3: 读取参考模板
- /home/z/my-project/upload/参考/原文提取.md(天工开物模板)
- /home/z/my-project/upload/参考/总结.md(吕氏春秋模板)
- /home/z/my-project/upload/参考/日志.md(晋会要模板)
Step 4: grep关键词检索
第一轮搜索(核心服饰词):
grep -n '衣裳|衣冠|冠服|裳服|服色|丝裳|衮|帔|褙|袄|裙|裤|襕|深衣|道服|鹤氅|巾帽|鱼袋|玉带|金带|缁衣|羽衣|布衣|野服|纱帽|锦丝|绶|佩|簪|笄|裘|袍|褐|帻|弁|襦'
→ 28条结果
第二轮搜索(织物与色彩词):
grep -n '罗|绮|绢|帛|绫|缎|绣|纹|绛|绯|锦|绡|纱|绶|翠|绾|貂'
→ 80条结果(含大量非服饰用法,如"罗列""翠微"等)
第三轮搜索(补充词):
grep -n '丝|绦|纁|缟|绡|纩|缣|绤|絺|褐|貂|舄|履|屐|笏|冕|帻|弁|冠'
→ 60条结果(含大量非服饰用法,如"丝弦""冠者"等)
Step 5: sed提取上下文
对筛选后的约40个关键行号逐一使用 sed -n 'X,Yp' 提取上下文,确认每条匹配的服饰含义。
Step 6: 分类整理
将有效服饰条目按10大类整理:
- 仙道服饰(7条)
- 丝织品与衣料(17条)
- 佩饰(7条)
- 冠帽(3条)
- 裘皮(1条)
- 履舄与屐(3条)
- 裳服(4条)
- 布衣身份(4条)
- 丝线类(3条)
- 其他(5条)
Step 7: 保存三份文件
- 原文提取.md(约8KB)
- 总结.md(约6KB)
- 日志.md(本文件)
关键发现
- 全书无系统服饰制度:诗集体裁决定了服饰内容为意象修辞而非制度记录
- 仙道服饰为核心主题:羽衣、野服、布衣构成吾衍的隐士服饰语汇
- 丝织品大量用于诗歌修辞:蝉翼罗、蛟绡、绛绡等多为李贺式修辞而非纪实
- "布衣"为身份标签:出现4次,是诗人自我认同的核心表达
- 裘皮仅1处且为对比:乌貂弊霜裘用于衬托羽衣之自在
- 吾衍临终着道士装束:玄绦缁笠,与其布衣道士身份一致
- 附录传记提供服饰信息:宋濂、王祎所撰传记记录吾衍日常服饰细节
踩坑记录
- 颜色词噪声极大:青、白、紫、黄等颜色词在诗中多为描写自然景物,与服饰无关,需逐一甄别
- "丝"字多义:约60%的"丝"匹配项为琴弦(丝弦、冰丝、氷丝)、蛛丝、柳丝等,非服饰用丝
- "罗"字多义:"罗列""森罗""包罗"等非服饰用法需排除
- "锦"字多义:"锦肠""锦楼"等为修辞而非服饰
- "冠"字多义:"冠军""冠者"(成年男子)非冠帽义
- "纹"字多义:铜镜纹饰(紫苔纹)、非服饰纹样
- 诗题不独占行:部分诗题与正文在同一行,需仔细辨认
审核结果
全部通过 ✅ — 原文均从源文件中grep+sed提取,有明确行号对应。约40条有效服饰条目已分类整理,排除了非服饰用法的噪声匹配。