《玉堂丛语》服饰内容提取 — 操作日志
日期:2026-03-05
任务:提取《玉堂丛语》全部服饰相关内容,整理分类总结
Step 0: 文件基本信息
wc -l -c /home/z/my-project/upload/part3/玉堂丛语.txt
# 结果:1024行 / 383867字节
# 文本性质:明·焦竑撰笔记(翰林院掌故)
Step 1: 读取关键词词库
# 词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md
Step 2: 第1轮 grep — 核心服饰词
rg -n '冠|冕|袍|裘|帻|幞头|裙|衫|褐|缙|绅|绫|罗|锦|绣|帛|绢|绸|缎|朝服|公服|常服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|笏|绶|靴|霞帔|簪|钗|鱼袋|服色|章服|品服|丧服|祭服|戎服|缂丝' /home/z/my-project/upload/part3/玉堂丛语.txt
第1轮命中统计
- 命中行数:约30+行
- 主要命中词:袍、冠、衣、服、帻、簪、裙、锦、绣、带、靴、帽、钗等
- 文本特征:明代笔记,以官服品色、赐服制度、冠服礼仪为主
Step 3: 第2轮 grep — 制度动作词
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/玉堂丛语.txt
| 行号 |
命中关键词 |
初步判定 |
| 374 |
冠礼 |
✅ 太子冠礼 |
| 462 |
僭(僭尘上听) |
❌ 排除(僭为僭越义,非服饰僭制语境) |
Step 4: 第3轮 — 按需扩展
rg -n '蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛' /home/z/my-project/upload/part3/玉堂丛语.txt
| 行号 |
命中关键词 |
初步判定 |
| 89 |
织(家应织) |
❌ 排除(织役,非服饰) |
| 117 |
桑(课农桑) |
❌ 排除(农政,非蚕桑) |
| 182 |
织(缉纺绵纱织布) |
✅ 纺织与布匹纳税 |
| 274 |
锦(天机锦) |
✅ 与第1轮重合 |
| 382 |
市舶 |
❌ 排除(非服饰语境) |
| 401 |
市舶 |
❌ 排除(非服饰语境) |
| 417 |
织(织造) |
✅ 明代织造制度 |
| 543 |
织(织布添花) |
✅ 织造与服饰 |
| 820 |
桑(桑枣榆柳) |
❌ 排除(树木,非蚕桑) |
| 821 |
桑(农桑辑要) |
❌ 排除(农书名) |
| 927 |
帕首裤靴 |
✅ 首服+体服+足服组合 |
| 1007 |
罗织 |
❌ 排除(罗织=构陷,非丝织品) |
Step 5: 排除规则审查
| 规则 |
应用场景 |
结果 |
| "衣冠"代指士大夫 |
多处 |
保留——仍含服饰信息 |
| "罗织"=构陷 |
行1007 |
已排除 |
| "僭尘上听"=僭越言语 |
行462 |
已排除(非服饰僭制) |
| "蚕桑"=农政 |
行117/820/821 |
已排除 |
| "织"=织役 |
行89 |
已排除 |
| "丝竹"=音乐 |
多处 |
已排除 |
排除后有效条目:约25条
操作流程轨迹
文件检查✅(1024行/384KB) → 读取词库✅ → 第1轮grep✅(30+行命中)
→ 第2轮grep✅(2行命中,1行有效) → 第3轮grep✅(12行命中,4行有效新增)
→ 排除审查✅(排除约7项) → 有效命中约25条 → 分类整理✅ → 生成3份文件
统计汇总
| 指标 |
值 |
| 文件大小 |
383,867 字节 / 1024 行 |
| 第1轮命中行 |
~30 |
| 第2轮命中行 |
1 |
| 第3轮新增命中行 |
4 |
| 排除误命中 |
~7 |
| 有效命中行 |
~20 |
| 有效服饰条目 |
~25 |
| 服饰类别数 |
6(官服品色/赐服/冠服制度/清廉象征/便服/女子服饰) |