《衡庐精舍藏稿》服饰内容提取 · 操作日志
时间:2026-04-19 14:30 — 15:15 任务:提取《衡庐精舍藏稿》全部服饰相关内容,整理分类总结 文件:/home/z/my-project/upload/四库别集/衡庐精舍藏稿.txt(2210行)
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/衡庐精舍藏稿/
Step 2: 查看参考模板
读取 /home/z/my-project/upload/参考/ 下三个MD模板:
- 总结.md(吕氏春秋服饰总结,261行)
- 日志.md(晋会要操作日志,84行)
- 原文提取.md(天工开物原文提取,165行)
Step 3: 文件基本情况
文件:衡庐精舍藏稿.txt
编码:UTF-8(CRLF换行)
行数:2210
内容:明·胡直撰,赋、乐府、古近体诗、序、记、传、墓志铭、杂著等
Step 4: 服饰关键词检索(第一轮——宽泛检索)
使用Python正则检索80余个服饰关键词:
衣|裳|冠|冕|弁|帻|巾|帽|履|鞋|袜|靴|袍|袂|衿|领|袖|裙|裤|
褐|裘|絺|绤|帛|锦|绣|织|纺|纱|绢|绸|缎|缯|绮|罗|绫|缟|纨|
布|丝|麻|葛|带|绶|佩|笏|簪|珮|饰|旒|黼|黻|
章服|朝服|祭服|丧服|常服|公服|礼服|法服|冠服|服色|服饰|舆服|
布衣|缁衣|深衣|衮服|龙袍|玉佩|冠带|巾冠|佩玉|加冠|冠礼|元服|命服|品服
结果:匹配416行。大量为诗歌中的文学性用词(如"罗"作人名/地名、"丝"作比喻等),需进一步筛选。
Step 5: 服饰关键词检索(第二轮——实质性检索)
针对更具体的服饰词汇进行第二轮检索:
章服|朝服|祭服|丧服|常服|公服|礼服|法服|冠服|服色|服饰|舆服|
布衣|缁衣|深衣|衮服|冠冕|冕服|冠带|佩玉|加冠|冠礼|元服|命服|品服|
麻冕|巾帻|黼衣|绣裳|锦衣|短衣|乌帽|纱帽|紫衣|铁衣|布褐|葛巾|
毡裘|纨袴|貂冠|乌纱|白纻|丝纶|衣冠|布帛|纨绮|初服|司服
结果:匹配60行。人工复核后,筛选出真正涉及服饰内容的关键行约40行。
Step 6: 上下文提取
对40个关键行号,各提取前2行至后1行的上下文,确保理解完整语境。
Step 7: 分类整理
将服饰内容分为四大类:
- 论说文中的服饰比喻(5处)——麻冕巾帻、锦衣短褐、纨绮布帛、不衣冠、章服
- 诗歌中的服饰意象(约20处)——黼衣绣裳、貂冠纨袴、布褐葛巾等
- 传记中的服饰记述(7处)——钗钏纺车、纺绩澣纫、冠服冠緌等
- 其他零散提及(约6处)
Step 8: 生成三份输出文件
- 衡庐精舍藏稿_总结.md(分类总结)
- 衡庐精舍藏稿_日志.md(本文件)
- 衡庐精舍藏稿_原文提取.md(原文片段)
关键发现
- 服饰内容极少:《衡庐精舍藏稿》2210行中,服饰实质性论述仅5处,且均为比喻性质
- 无服饰制度记载:全书不含任何系统的服饰制度、工艺或习俗描述
- "不衣冠"之辨最有价值(行1852):论证衣冠与礼、仁的关系,有思想史意义
- "麻冕巾帻"之喻次之(行973):借古制与现代头饰的关系喻诗歌体制
- 诗歌中的服饰为修辞:黼衣绣裳、冠切云等均化用古典,非写实描写
- 传记中的服饰反映明代实际:钗钏、纺车、衣布、脱簪等反映中下层士人家庭生活
- "锦衣"有双重含义:行701"余锦衣奉命"中"锦衣"为官职名(锦衣卫),非服饰
关键踩坑记录
- 大量"罗"字出现为人名或地名(如罗文庄、罗日表),非丝织品含义,需逐一排除
- "丝纶"多指"皇帝诏令"(丝纶阁),非丝织品
- "佩玉"在诗歌中多为比喻修辞,非实际佩饰描述
- "衣"字在"衣布""衣德"等用法中为动词(穿衣/践行),非名词
- "冠"在"冠绝""冠军"等用法中为动词或形容用法,非头饰
- "锦衣"在行701为官职名(锦衣卫指挥),行1697为服饰名词,需区分
- 文件为CRLF换行,但Python读取正常
- grep直接搜索因编码问题报错,改用Python正则检索
审核结果
全部通过 ✅ — 原文均从衡庐精舍藏稿.txt中Python正则提取,有明确行号对应。无服饰内容的部分亦如实记录。