《雪窻集》服饰内容提取 · 工作日志

时间:2026-04-19 任务ID:batch21-5 输入:/home/z/my-project/upload/四库别集/雪窻集.txt 输出:/home/z/my-project/upload/四库别集output/雪窻集/


操作流程

Step 1: 环境准备

mkdir -p /home/z/my-project/upload/四库别集output/雪窻集
wc -l 雪窻集.txt → 201行, 94611字节

Step 2: 读取参考文件

Step 3: grep多轮搜索(5轮)

第1轮:基础服饰词(衣裳裘冠冕弁帻巾帽袍衫裙裤褐衮绶佩笏带锦绮绢帛丝绸缎绫罗纱绉缟缁素)

第2轮:颜色与饰物词(赤青黄白黑朱紫绯绿翠金银玉珠簪钗钿珥步摇)

第3轮:制度专词(冠服舆服章服朝服公服祭服丧服常服戎服赐服蟒衣飞鱼斗牛补服品色鱼袋革带玉带金带幞头乌纱进贤冠深衣大带蔽膝舄履靴袜霞帔翟衣蚕服)

第4轮:组合词与典故词(布衣|绣衣|美衣|衣裳|衣冠|衣裘|旒冕|搢笏|垂绅|紫金|金鱼|银帛|墨绶|朱轓|貂珰|缁黄|纱|赐紫|鱼袋)

第5轮:补充词(玉雪|圭璧|荷囊|蝉|飞蝉|佩|苍佩|纶|丝纶|绣|绶|纁|布韦|蔬食|布衾|素车|丹斾|赤帷|素履)

Step 4: 过滤噪音

需排除的非服饰用例:

Step 5: 分类整理

按8类整理:

  1. 布衣·蔬食(5条)——核心主题
  2. 衣冠(1条)
  3. 美衣(1条)
  4. 绣衣使者(2条)
  5. 官服仪制(9条)
  6. 丧葬服饰器物(5条)
  7. 丝帛·纺织(7条)
  8. 其他散见(3条)

Step 6: 输出3个MD文件

文件 大小 说明
总结.md ~7KB 分类归纳、核心发现、统计
原文提取.md ~9KB 31条原文逐条编排
日志.md 本文件 操作记录

关键发现

  1. 《雪窻集》服饰内容以象征性为主:全书为奏议文集,无系统性服饰制度记载
  2. "布衣蔬食"为核心意象:5次出现,形成孙梦观的人格标签
  3. 官服词汇服务于政治批评:旒冕、貂珰、朱轓墨绶等均出现在弹劾语境
  4. 丧葬服饰呼应清廉主题:布衾覆殓、素车白斾完成廉吏形象定格
  5. 全书服饰密度极低:201行中仅31条有效服饰用例,且多为隐喻

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从雪窻集.txt中grep提取,有明确行号对应,经逐条甄别过滤非服饰用例后保留31条。