《清献集》服饰内容提取 · 操作日志
时间:2026-04-19 任务ID:batch-r2-a 书名:清献集(宋杜范) 源文件:/home/z/my-project/upload/四库别集/清献集(宋杜范).txt 输出目录:/home/z/my-project/upload/四库别集output/清献集(宋杜范)/
操作流程
Step 1: 创建输出目录
mkdir -p "/home/z/my-project/upload/四库别集output/清献集(宋杜范)/"
→ 成功
Step 2: 查看文件总行数
wc -l "/home/z/my-project/upload/四库别集/清献集(宋杜范).txt"
→ 1036行
Step 3: 五轮grep扫描
R1: 核心服饰词
grep -n '衣|裳|服|袍|袂|裾|襟|衫|裘|褐|襦|袴|裙|帔|氅|蓑|裟|袈'
→ 命中约80行,大部分为诗歌中的衣物描写或奏疏中的比喻用法
R2: 冠帽佩饰词
grep -n '冠|帽|冕|弁|帻|簪|钗|佩|珮|绶|带|钩|环|珥|璎|珠|玦|玉|袋'
→ 命中约60行,多为"弹冠""冕旒"等典故或代称用法
R3: 丝织品类词
grep -n '绢|绸|缎|绫|罗|纱|缯|帛|锦|缣|绮|缟|纨|练|丝|茧'
→ 命中约30行,包含"纲绢""锦囊""净练晴绮"等
R4: 材料染织词
grep -n '染|织|绣|纹|黼|黻|青|赤|朱|紫|黄|白|玄|绿|绛|绯|赭|丹|蓝|翠'
→ 命中约100行,大量为景物描写中的颜色词,与服饰相关者极少
R5: 鞋履制度词
grep -n '履|鞋|靴|舄|屦|屐|屣|袜|韦|弁|笏|仪|制|章'
→ 命中约30行,"纳履""韦布"为有效条目
Step 4: 关键行上下文提取
使用sed对以下关键行号提取上下文(前2行后5行):
- L70(整冠)
- L80(衣裳破无补)
- L82(被褐)
- L227(尘衫野服)
- L268-270(皂盖/素锦/弹冠)
- L272(衫青)
- L333(冕旒韦布)
- L354-355(青衫/丽服弊衣)
- L554(衣冠之喻)
- L600(纲绢)
- L1015(幅巾深衣/冠昏丧祭)
Step 5: 过滤非服饰用法
剔除的条目(纯比喻/纯写景/无服饰信息):
- L96"文绣被泥土":保留(虽为比喻但涉及实际纺织品概念)
- L132"激激风吹衣":剔除(纯写旅途,无服饰信息)
- L186"千袍同鼓舞":剔除(袍仅代指考生)
- L284"簪裾":保留(官服代称)
- L312"襟裾":剔除(纯写景比喻)
- L366"残雪沾衣":剔除(纯景物)
- L445"怯春衣":剔除(文学性用法,无服饰信息)
- L469/508"白衣":保留(典故服饰)
- L639/677"冕旒":保留(皇权服饰符号)
- L866"衣冠俨立":剔除(纯拟人修辞)
- L959"净练晴绮":保留(丝织品喻景,有材质信息)
最终有效条目:27条
Step 6: 撰写三份MD文档
- 清献集(宋杜范)_原文提取.md:含行号引用,关键词加粗
- 清献集(宋杜范)_总结.md:服饰结构化综述+对抗式学术审查
- 清献集(宋杜范)_日志.md:本文件
关键发现
- 青衫(L354):南宋低级文官标志性服色,杜范自嘲"强裹青衫空自累"
- 幅巾深衣(L1015):黄灏退隐服饰,南宋理学学者标准装束
- 纲绢赋税(L600):非蚕桑产地强制本色输绢之弊
- 衣冠之喻(L554):以衣冠新旧比喻改革真伪,全书最深刻的服饰论述
- 冕旒与韦布(L333):冠冕与布衣对举,反映宋代服饰等级符号
- 冠昏丧祭(L1015):黄灏奏请恢复冠礼等仪制
踩坑记录
- 文件名含括号"(宋杜范)",grep/sed命令需加引号
- R4颜色词扫描命中率极高但有效信息极低,大量"翠""青""丹"为山水写景
- R5扫描因编码问题失败一次,后改用更精准的关键词组合
- 奏疏中"衣冠""冕旒"多为代称/比喻,非服饰制度描述,需谨慎甄别
- 全书无专门舆服章节,服饰信息密度极低(约2.6%)
审核结果
全部通过 ✅ — 原文均从源文件grep提取,有明确行号对应,未编造任何原文。