《梧冈集》服饰内容提取 · 工作日志
任务ID:batch1-1 书名:梧冈集(明·汪文凤) 源文件:/home/z/my-project/upload/四库别集/梧冈集.txt 输出目录:/home/z/my-project/upload/四库别集output/梧冈集/ 处理时间:2026-03-05
操作流程
Step 0: 基本信息
- 源文件总行数:2161行
- 创建输出目录:mkdir -p /home/z/my-project/upload/四库别集output/梧冈集/
Step 1: 五轮grep扫描
R1: 基础服饰词(衣裳冠袍裘褐襦袄裙裤衮帔深衣道服鹤氅衣冠冠服服色裳服)
grep -n '衣\|裳\|冠\|冕\|袍\|裘\|带\|佩\|履\|舄\|簪\|笄\|巾\|帻\|弁\|襦\|褐\|锦\|绮\|绢\|帛\|绫\|罗\|缎\|丝\|麻\|葛\|绶\|黼\|黻\|绣\|纹\|绛\|绯\|紫\|青\|朱\|玄\|黄\|白\|裳服\|冠服\|衣冠\|服色\|衮\|帔\|褙\|袄\|裙\|裤\|襕\|深衣\|道服\|鹤氅\|巾帽\|鱼袋\|玉带\|金带'
命中:375行(含大量"白""青""黄""紫"等颜色字非服饰用法)
R2: 冠帽佩饰词
grep -n '冠\|冕\|弁\|巾\|帻\|帽\|簪\|笄\|缨\|珥\|钗\|钿\|翠\|步摇\|花胜\|梳'
命中:88行(含大量"翠"非首饰用法,如"翠微""翠壁")
R3: 丝织品/材料词
grep -n '锦\|绮\|绢\|帛\|绫\|罗\|缎\|绸\|纱\|缟\|纨\|绨\|缂\|丝\|麻\|葛\|苎\|布\|毡\|绵\|褐'
命中:98行(含大量"锦"作地名/比喻,"布"多非布料义)
R4: 染织纹饰词
grep -n '绛\|绯\|紫\|青\|朱\|玄\|黄\|白\|赤\|绿\|墨\|皂\|染\|绣\|纹\|黼\|黻\|织\|纺'
命中:330行("白""黄""青""紫"等颜色字大量非服饰用法)
R5: 鞋履制度词
grep -n '履\|舄\|屦\|屐\|靴\|鞋\|袜\|带\|绶\|佩\|鱼袋\|玉带\|金带\|衮\|章服\|朝服\|祭服\|丧服\|冠服\|服色\|深衣\|道服\|鹤氅\|裳服\|衣冠'
命中:65行
Step 2: 关键行提取与去重
五轮grep合计命中约956行次,大量重叠。去重后涉及约120个独立行号。
Step 3: 逐条甄别与过滤
以下为非服饰语境过滤清单:
| 关键词/短语 | 行号 | 原因 |
|---|---|---|
| 衣锦乡 | L67,69,81,94,99,794,800,2029,2033,2041 | 地名,非服饰描写(但"衣锦"本身含服饰语义,保留提及) |
| 衣带水 | L175 | 成语"一衣带水",形容河流狭窄 |
| 锦里 | L77 | 地名 |
| 白衣苍狗 | L614 | 成语"白云苍狗"异写,喻世事变化 |
| 衮轻尘 | L552 | "衮"此处为动词"滚动",非衮服 |
| 金钗股 | L1625 | 喻萱草花蕊,非实际首饰 |
| 挂冠 | L1673,2021 | "挂冠"=辞官,固定成语 |
| 箕裘之业 | L1341,1819 | 成语,喻祖传技艺 |
| 弁于巻端 | L1705 | "弁"此处为序言义,非弁冠 |
| 书绅 | L2021 | 成语"书绅"=铭记,绅为借代 |
| 韦布之秀 | L1945 | "韦布"=平民代称 |
| 絇屦/絇履 | L1945,2119 | 敬语,指长者足迹 |
| 执绋 | L1957 | 送葬用语 |
| 珠襦 | L1673 | "玉匣珠襦"为墓葬用语,非日常服饰 |
| 佩剑 | L1079,1677,1962 | 剑器,非服饰 |
过滤后保留有效服饰条目:约55条。
Step 4: 分类整理
将55条有效条目分为七大类:
- 仕宦服饰与身份标识(10条)
- 隐逸与僧道服饰(12条)
- 孝道服饰:彩衣与斑衣(6条)
- 边塞与军旅服饰(4条)
- 赏赐服饰与制度(5条)
- 文学意象中的服饰(10条)
- 衣冠族群与社会服饰(5条)
- 其他零散3条
Step 5: 撰写三份MD
| 文件 | 大小 | 内容 |
|---|---|---|
| 梧冈集_原文提取.md | ~8.8KB | 55条服饰原文,按7类分章 |
| 梧冈集_总结.md | ~8.3KB | 5大核心发现+类型分布+对抗式审查 |
| 梧冈集_日志.md | 本文件 | 操作流程与过滤记录 |
Step 6: 对抗式学术审查
审查要点:
- L686陈桥兵变服饰为画作描写,不可等同于宋初实录
- L1193"品服"之政治意义可能被过度解读
- 全书女性服饰几乎空白,此缺失本身有研究价值
- "衣锦乡"地名10见未详论,可能遗漏服饰文化记忆层
- "獬豸冠"为古称沿用,明代实际已改獬豸补子
关键踩坑记录
- 颜色字(白/青/黄/紫/玄/绛)在R1和R4中产生大量伪命中,约占总命中的60%,需逐条甄别
- "衣"字作动词用法("衣之"=给人穿衣,L1945)需与名词用法区分
- "裘"在"箕裘"中为成语用法,非实际皮裘
- "衮"在"衮轻尘"中为动词,非衮服
- "冠"作动词("冠盖""冠以")需与名词用法区分
处理完成。