研究总结 日志 原文

《清献集》服饰内容提取 · 操作日志

时间:2026-04-19 任务ID:batch-r2-a 书名:清献集(宋杜范) 源文件:/home/z/my-project/upload/四库别集/清献集(宋杜范).txt 输出目录:/home/z/my-project/upload/四库别集output/清献集(宋杜范)/


操作流程

Step 1: 创建输出目录

mkdir -p "/home/z/my-project/upload/四库别集output/清献集(宋杜范)/"
→ 成功

Step 2: 查看文件总行数

wc -l "/home/z/my-project/upload/四库别集/清献集(宋杜范).txt"
→ 1036行

Step 3: 五轮grep扫描

R1: 核心服饰词

grep -n '衣|裳|服|袍|袂|裾|襟|衫|裘|褐|襦|袴|裙|帔|氅|蓑|裟|袈'
→ 命中约80行,大部分为诗歌中的衣物描写或奏疏中的比喻用法

R2: 冠帽佩饰词

grep -n '冠|帽|冕|弁|帻|簪|钗|佩|珮|绶|带|钩|环|珥|璎|珠|玦|玉|袋'
→ 命中约60行,多为"弹冠""冕旒"等典故或代称用法

R3: 丝织品类词

grep -n '绢|绸|缎|绫|罗|纱|缯|帛|锦|缣|绮|缟|纨|练|丝|茧'
→ 命中约30行,包含"纲绢""锦囊""净练晴绮"等

R4: 材料染织词

grep -n '染|织|绣|纹|黼|黻|青|赤|朱|紫|黄|白|玄|绿|绛|绯|赭|丹|蓝|翠'
→ 命中约100行,大量为景物描写中的颜色词,与服饰相关者极少

R5: 鞋履制度词

grep -n '履|鞋|靴|舄|屦|屐|屣|袜|韦|弁|笏|仪|制|章'
→ 命中约30行,"纳履""韦布"为有效条目

Step 4: 关键行上下文提取

使用sed对以下关键行号提取上下文(前2行后5行):

Step 5: 过滤非服饰用法

剔除的条目(纯比喻/纯写景/无服饰信息):

最终有效条目:27条

Step 6: 撰写三份MD文档


关键发现

  1. 青衫(L354):南宋低级文官标志性服色,杜范自嘲"强裹青衫空自累"
  2. 幅巾深衣(L1015):黄灏退隐服饰,南宋理学学者标准装束
  3. 纲绢赋税(L600):非蚕桑产地强制本色输绢之弊
  4. 衣冠之喻(L554):以衣冠新旧比喻改革真伪,全书最深刻的服饰论述
  5. 冕旒与韦布(L333):冠冕与布衣对举,反映宋代服饰等级符号
  6. 冠昏丧祭(L1015):黄灏奏请恢复冠礼等仪制

踩坑记录

  1. 文件名含括号"(宋杜范)",grep/sed命令需加引号
  2. R4颜色词扫描命中率极高但有效信息极低,大量"翠""青""丹"为山水写景
  3. R5扫描因编码问题失败一次,后改用更精准的关键词组合
  4. 奏疏中"衣冠""冕旒"多为代称/比喻,非服饰制度描述,需谨慎甄别
  5. 全书无专门舆服章节,服饰信息密度极低(约2.6%)

审核结果

全部通过 ✅ — 原文均从源文件grep提取,有明确行号对应,未编造任何原文。