《谷响集》服饰内容提取 · 对话记录
时间:2026-04-19 任务:提取《谷响集》全部服饰相关内容,整理分类总结 任务ID:batch3-1
操作流程
Step 1: 创建输出目录 & 读取参考文件
mkdir -p /home/z/my-project/upload/四库别集output/谷响集
读取三个参考MD(总结/日志/原文提取),了解输出格式要求。
Step 2: 源文件概况
wc -l 谷响集.txt → 1402行
《谷响集》三卷,元释善住撰,属四库全书集部别集类。
- 卷一:五言律诗(行20-458)
- 卷二:七言律诗(行460-810)
- 卷三:五言绝句等(行812-1402)
Step 3: Grep多轮搜索
第一轮:基础关键词
rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐' → 多行
rg -n '衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素' → 多行
rg -n '赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇' → 352行
注:颜色词噪音极大("青山""白云"等),需二次过滤。
第二轮:复合服饰词
rg -n '赐衣|锦袍|麻衣|衲衣|布衣|短褐|裋褐|蓑衣|纱帽|乌帽|貂裘|羊裘|茧衣|苎袍|征袍|敝袍|云袍|仙袍|衣冠|衣裳' → 28条有效
rg -n '轩冕|鹤氅|华阳巾|巾舄|巾锡|束帛|缁尘|素丝|丝桐|绮罗|罗绮|锦绣|文锦|紫锦绦|花钿|裙带|翠带' → 多条有效
第三轮:专有名词
rg -n '冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服' → 7行
注:本书为诗僧文集,无制度性舆服记载,专有名词命中率极低。
第四轮:补充搜索
rg -n '纫衣|白纻|絺衣|裌衣|传衣|田衣|绛纱|青鞵|乌靴|翠羽|绀发|同袍|红莲' → 多条有效
Step 4: 过滤噪音
剔除的噪音类型:
- 颜色词非服饰用法:青山、白云、黄叶、绿竹、朱夏等(约90%的颜色词匹配为噪音)
- 丝/带/佩非服饰用法:丝桐(琴)、带雨/带烟/带露(动词)、佩心印(禅宗)
- 锦非服饰用法:锦心(文才)、锦翼(鸟羽)、锦绣肠(文学才华比喻)
- 衣非服饰用法:苔衣(苔藓)、荷衣(荷叶喻)
- 罗非服饰用法:罗浮(地名)、罗生(分布)
- 帛非服饰用法:束帛为典故引用(《周易》)
保留的边界案例:
- 金衣:虽喻黄莺鸟,但用服饰词作比喻,保留并标注
- 苔衣/荷衣:纯比喻用法,排除
- 丝桐:乐器用丝,非服饰,排除
- 束帛:典故中有服饰制度背景,保留
Step 5: 分类整理
按8大类整理:
- 僧服与隐逸服饰(11小项)
- 冠帽巾帻(10小项)
- 官服与朝仪(6小项)
- 裘服(2小项)
- 首饰佩饰(5小项)
- 鞋履(4小项)
- 织物与纺织(8小项)
- 文学性服饰意象(12小项)
Step 6: 保存三份文件
- 总结.md(约8.5KB)
- 原文提取.md(约9KB)
- 日志.md(本文件)
关键发现
- 本书为诗僧文集,服饰内容全部为诗歌意象,无制度性记载,与《吕氏春秋》《晋会要》等制度文献性质根本不同
- 僧服与隐逸服饰占绝对主体:衲衣、布衣、短褐、苎袍、敝袍、蓑衣等反复出现,反映作者僧侣隐逸身份
- 道教服饰自成一组:鹤氅华阳巾、霞佩星冠,出现在赠羽人诗中,反映元代佛道交游
- "故衣冠"意象具史料价值:两处"故衣冠"表达宋遗民情感,与提要"犹及见宋之遗老"呼应
- 赐衣锦袍为唯一朝仪实证:赵孟頫入觐赐衣之记,反映元代文臣优宠制度
- 日本僧与爵服:"爵服才分语不同"反映元代中日品级服饰差异认知
- 服饰意象的文学化:金衣喻莺、翠带喻花、湘云作衣等,服饰词高度文学化
关键踩坑记录
- 颜色词噪音极大(352行匹配中约90%为非服饰用法),需逐一过滤
- "丝"字在诗集中多用于琴弦(丝桐)而非纺织
- "带"字多用为动词(带雨/带烟/带露),真正服饰用法仅紫锦绦、裙带、翠带数条
- "佩"字半数为禅宗"心印"用法,非实体玉佩
- 四库馆臣抄本用字与今不同:鞵=鞋、舄=履、巻=卷、防=数、乡=向等
- 文本无标点,诗句需自行断句
统计
| 指标 | 数值 |
|---|---|
| 源文件总行数 | 1402 |
| grep总匹配行数(含噪音) | ~520 |
| 有效服饰相关行数 | ~70 |
| 分类条目数 | 8大类58小项 |
| 总结.md | ~8.5KB |
| 原文提取.md | ~9KB |
| 日志.md | ~3KB |
审核结果
全部通过 ✅ — 原文均从四库全书原文grep提取,有明确行号对应。噪音已过滤,文学比喻已标注。