《闻过斋集》服饰内容提取 · 操作日志
时间:2026-03-04 任务ID:batch15-3 目标:提取《闻过斋集》全部服饰相关内容,整理分类总结
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/闻过斋集
检查源文件:闻过斋集.txt → 627行,190,851字节
读取参考模板:总结.md、日志.md、原文提取.md
Step 2: 多轮grep检索
第一轮:基础服饰词
grep -n '衣\|裳\|裘\|冠\|冕\|弁\|帻\|巾\|帽\|袍\|衫\|裙\|裤\|褐' 闻过斋集.txt
→ 35行命中
第二轮:织物/佩饰词
grep -n '衮\|绶\|佩\|笏\|带\|锦\|绮\|绢\|帛\|丝\|绸\|缎\|绫\|罗\|纱\|绉\|缟\|缁' 闻过斋集.txt
→ 20行命中
第三轮:颜色/珠宝词
grep -n '素\|赤\|青\|黄\|白\|黑\|朱\|紫\|绯\|绿\|翠\|金\|银\|玉\|珠\|簪\|钗\|钿\|珥\|步摇' 闻过斋集.txt
→ 114行命中(大量噪音,颜色词在山水描写中极常见)
第四轮:复合词精准搜索
grep -n '衣裳\|衣冠\|朝服\|公服\|祭服\|丧服\|常服\|戎服\|赐服\|章服\|冠服\|舆服' 闻过斋集.txt
→ 命中:衣冠(405行)、冠服(427行)
grep -n '蟒衣\|飞鱼\|斗牛\|补服\|品色\|鱼袋\|革带\|玉带\|金带\|幞头\|乌纱\|进贤冠\|深衣\|大带\|蔽膝\|舄\|履\|靴\|袜\|霞帔\|翟衣\|蚕服' 闻过斋集.txt
→ 命中:舄(375行)、履(471行)、袜(607行)
第五轮:单字深搜
grep -n '衣' 闻过斋集.txt → 10行有效命中
grep -n '冠\|冕\|弁' → 8行有效命中
grep -n '袍\|绂\|绯\|紫' → 4行有效命中
grep -n '衰麻\|丧服\|绖\|襁褓\|黄冠\|章甫\|逢掖' → 5行有效命中
grep -n '带\|履\|靴\|袜\|裘\|葛\|麻\|布' → 8行有效命中(含大量噪音)
Step 3: 过滤噪音
大量排除的情况:
- 颜色词在山水描写中的用法(如"翠"指山色、"紫翠"指远景)→ 排除
- "布"作"布列""宣布"义 → 排除
- "素"作"素来""本素"义 → 排除
- "丝"作"丝竹""毫丝"义 → 排除
- "金"作地名/人名/金钱义 → 排除
- "带"作地理带状描述(如"澄江带如萦")→ 排除
- "服"作"服丧""服从"义 → 保留"黄冠服""冠服"
- "衣"作"衣(动词)某处"→ 保留有服饰义的
最终有效条目:25条,涉及14个行号段落
Step 4: 分类整理
按内容分为8大类:
- 衣裳起源与古制(2条)
- 冠服制度与政治变迁(5条)
- 衣冠与门第传承(1条)
- 隐逸服饰(6条)— 本集最丰富的服饰内容
- 丧葬服饰(2条)
- 冠礼(2条)
- 服饰与生活伦理(4条)
- 织物与色彩(3条)
Step 5: 输出三份文件
| 文件 | 大小 | 内容 |
|---|---|---|
| 总结.md | ~6KB | 分类总结,含9大板块+总表+核心特征 |
| 原文提取.md | ~5KB | 25条原文按类编排,标注行号 |
| 日志.md | 本文件 | 操作流程、关键发现、踩坑记录 |
关键发现
- 冠服变迁为元明鼎革核心符号:韩公因"新制变冠服"终身着帽不去,王翰著"黄冠服"十年后自尽——服饰成为政治立场与气节的终极表达
- 隐逸服饰谱系完整:箨冠卉服、黄冠服、麻袍草履、鹿裘索带、逢掖章甫、青鞋布袜,六组隐者服饰构成完整谱系
- 赐袍笏为元代科举制度:天历庚午进士及第赐袍笏,为元代科举服饰实证
- 青袍绯紫反映品色衣制:"青袍足章何必绯紫"反映元明品色衣制度
- 丧服饰物描写完整:衰麻菲履杖绖环,五件丧饰物齐全
- 蚕绩供给衣服:孙夫人勤蚕绩以给衣服,反映元末家庭纺织自给的实态
关键踩坑记录
- 颜色词(赤青黄白黑朱紫绿翠金银玉珠)命中极多(114行),但90%为山水描写用词,非服饰相关,需逐一排除
- "服"字在本文集中大量作"服从""服丧""服食"义,仅"冠服""黄冠服""丧服"等为服饰义
- "带"字多为地理带状描写("带如萦""带郡城"),仅"绳带""索带""绖"为服饰义
- "衣"字作动词"穿衣"(如"衣皮")亦属服饰范畴,需保留
- 部分四库本缺字以【阙】标注,不影响服饰内容提取
审核结果
全部通过 ✅ — 原文均从四库本grep提取,有明确行号对应。噪音已过滤,25条有效条目均有服饰实义。