《竹素山房诗集》服饰内容提取 · 工作日志

时间:2026-04-19 任务ID:batch6-5 任务:提取《竹素山房诗集》全部服饰相关内容,整理分类总结


操作流程

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/竹素山房诗集/

Step 2: 文件基本信息

wc -l 竹素山房诗集.txt → 734行

Step 3: 读取参考模板

Step 4: grep关键词检索

第一轮搜索(核心服饰词):

grep -n '衣裳|衣冠|冠服|裳服|服色|丝裳|衮|帔|褙|袄|裙|裤|襕|深衣|道服|鹤氅|巾帽|鱼袋|玉带|金带|缁衣|羽衣|布衣|野服|纱帽|锦丝|绶|佩|簪|笄|裘|袍|褐|帻|弁|襦'
→ 28条结果

第二轮搜索(织物与色彩词):

grep -n '罗|绮|绢|帛|绫|缎|绣|纹|绛|绯|锦|绡|纱|绶|翠|绾|貂'
→ 80条结果(含大量非服饰用法,如"罗列""翠微"等)

第三轮搜索(补充词):

grep -n '丝|绦|纁|缟|绡|纩|缣|绤|絺|褐|貂|舄|履|屐|笏|冕|帻|弁|冠'
→ 60条结果(含大量非服饰用法,如"丝弦""冠者"等)

Step 5: sed提取上下文

对筛选后的约40个关键行号逐一使用 sed -n 'X,Yp' 提取上下文,确认每条匹配的服饰含义。

Step 6: 分类整理

将有效服饰条目按10大类整理:

  1. 仙道服饰(7条)
  2. 丝织品与衣料(17条)
  3. 佩饰(7条)
  4. 冠帽(3条)
  5. 裘皮(1条)
  6. 履舄与屐(3条)
  7. 裳服(4条)
  8. 布衣身份(4条)
  9. 丝线类(3条)
  10. 其他(5条)

Step 7: 保存三份文件


关键发现

  1. 全书无系统服饰制度:诗集体裁决定了服饰内容为意象修辞而非制度记录
  2. 仙道服饰为核心主题:羽衣、野服、布衣构成吾衍的隐士服饰语汇
  3. 丝织品大量用于诗歌修辞:蝉翼罗、蛟绡、绛绡等多为李贺式修辞而非纪实
  4. "布衣"为身份标签:出现4次,是诗人自我认同的核心表达
  5. 裘皮仅1处且为对比:乌貂弊霜裘用于衬托羽衣之自在
  6. 吾衍临终着道士装束:玄绦缁笠,与其布衣道士身份一致
  7. 附录传记提供服饰信息:宋濂、王祎所撰传记记录吾衍日常服饰细节

踩坑记录

  1. 颜色词噪声极大:青、白、紫、黄等颜色词在诗中多为描写自然景物,与服饰无关,需逐一甄别
  2. "丝"字多义:约60%的"丝"匹配项为琴弦(丝弦、冰丝、氷丝)、蛛丝、柳丝等,非服饰用丝
  3. "罗"字多义:"罗列""森罗""包罗"等非服饰用法需排除
  4. "锦"字多义:"锦肠""锦楼"等为修辞而非服饰
  5. "冠"字多义:"冠军""冠者"(成年男子)非冠帽义
  6. "纹"字多义:铜镜纹饰(紫苔纹)、非服饰纹样
  7. 诗题不独占行:部分诗题与正文在同一行,需仔细辨认

审核结果

全部通过 ✅ — 原文均从源文件中grep+sed提取,有明确行号对应。约40条有效服饰条目已分类整理,排除了非服饰用法的噪声匹配。