《雪坡集》服饰内容提取 · 操作日志
时间:2026-04-20 任务ID:batch20-4 操作员:AI Agent
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/雪坡集
wc -l 雪坡集.txt → 2588行
Step 2: 读取参考文件
/home/z/my-project/upload/参考/总结.md → 吕氏春秋服饰总结(261行)
/home/z/my-project/upload/参考/日志.md → 晋会要操作日志(84行)
/home/z/my-project/upload/参考/原文提取.md → 天工开物原文提取(165行)
结论:参照日志格式记录流程,总结采用分类+表格,原文提取按主题分节附行号。
Step 3: grep多轮搜索
第1轮:复合服饰词(精准搜索)
grep -n '衣裳\|赐衣\|授衣\|衣钵\|衣冠\|布衣\|缊袍\|鹄袍\|绿袍\|赭袍\|锦袍\|衮衣\|龙袍' → 16条
grep -n '深衣\|大带\|笏\|槐笏\|绶\|紫绶\|绿绶\|银鱼\|金鱼\|鱼袋\|幞头\|舄\|履舄\|靴\|袜\|丝鞭\|金带\|玉带\|革带' → 15条
grep -n '狐裘\|羔裘\|弊裘\|褐衣\|短褐\|丝帛\|绢帛\|绫罗\|锦绮\|纱罗\|缟素\|缁衣\|紫袍\|绯鱼\|银鱼\|金鱼\|鱼袋\|簪缨\|簪裳\|步摇\|霞帔\|蚕服\|朝服\|祭服\|丧服\|常服\|章服\|公服' → 22条
grep -n '缁衣\|簪缨\|冠礼\|加冠\|蟒衣\|补服\|青衿\|子衿\|黼黻\|文绣\|左衽\|丝帛\|锦绮\|纱罗\|绫罗\|方袍\|圆顶\|布裙\|荆钗\|罗裙\|翠袖\|红裙\|霓裳\|翟茀\|鱼轩\|宝钗\|燕钗' → 28条
grep -n '衮冕\|冕旒\|冠带\|佩玉\|簪笏\|赐紫\|赐绯\|绯袍\|朱衣\|朱紫\|文绣\|衣钵\|荷衣\|芰荷\|左衽\|霓裳\|黄衣\|赭黄\|赭袍\|玉笏\|槐笏\|白简\|象笏\|银绯\|银青\|金紫\|紫泥\|章甫\|峨冠\|博带\|衣冠' → 35条
第2轮:单字高频词筛选(已排除纯虚词噪音)
grep -n '衣\|裳\|裘\|袍\|衫\|裙\|褐\|衮\|绶\|笏\|佩\|带\|冠\|冕\|弁\|巾\|帽\|幞\|纱\|绫\|罗\|绢\|帛\|丝\|锦\|绮\|缟\|缁\|簪\|钗\|钿\|珥\|履\|舄\|靴\|袜\|霞帔\|翟' → 702行(含大量噪音)
→ 仅作辅助参考,以第1轮精准结果为主
Step 4: sed提取关键行上下文
对每条精准匹配,读取前后文确认服饰语境,剔除以下噪音:
- "衣"字作动词(衣锦还乡→保留,因含服饰义)
- "冠"作"冠绝"解(如"冠天下")→剔除
- "丝"作"丝线""蛛丝"解与服饰无关→剔除
- "佩"作"佩服"解→剔除
- "翠""赤"等颜色词无服饰语境→剔除
过滤后有效服饰条目:约60条
Step 5: 分类整理
将60条有效内容归入9大类别:
- 朝服与品级服饰(天子赭袍、衮衣、官品服色等)
- 冠帽与头饰(幞头、吟帽、宝钗等)
- 士人服饰(青衿、深衣大带、荷衣等)
- 女性服饰(象服、翟茀、霓裳、罗裙等)
- 笏板与佩饰(槐笏、丝鞭、鱼袋等)
- 纺织与丝织品(锦、鲛绡、黼黻文章等)
- 僧道与特殊服饰(圆顶方袍、氅衣等)
- 典故服饰(周公衮衣、葛巾漉酒、老莱斑衣等)
- 仪制相关(冠礼、册立、赐服等)
Step 6: 输出三份文件
- 总结.md:分类总结+表格(本文件)
- 原文提取.md:按主题附原文及行号
- 日志.md:操作流程记录(本文件)
关键发现
- 槐笏工艺记述最详(L1954):记京师朝天门富宁制笏为第一,详述笏之形制象征(圭锐象仁、砥平象义、润象洁、直象刚),并引魏徵谏笏、段秀实击贼笏为典范,为集中最有服饰器物学价值的条目。
- 青衿学服制度(L302):释《诗·子衿》"青青子衿"为学子入学之服,"青东方木也,木属仁,古之学者以求仁为第一事故入学之服皆服青",为宋代学服色彩制度的重要注解。
- 赭袍黄屋帝服(L884、L2285):两处提及帝服赭黄色,为南宋帝服色彩的实际记录。
- 幞头赠诗(L587):专门写赠幞头之诗,反映宋代文人日常以幞头为赠品的社交习俗。
- 圆顶方袍僧服(L2381):"圆顶方袍"为僧人标准服饰描述,圆顶即落发,方袍即僧衣。
- 衮衣典故高频:衮衣作为宰辅归朝的象征,在启札中反复使用(L1340、L2307),反映宋人对周公衮衣归的典故熟知。
- 女性服饰多在词作:霓裳、罗裙、宝钗、翠袖等几乎全出现在词作中,用于描写歌舞、婚嫁场景。
踩坑记录
- 全文2588行,单字搜索"衣"返回702行,噪音极大;必须用复合词精准搜索
- 部分服饰词为典故化用(如"荷衣""衮衣"),实非实物描写,但仍有服饰史参考价值
- "衣冠"一词在集中既指实物服饰(L557"先世衣冠正此藏"),也指士人阶层(L1137"衣冠盛事图"),需区分
- "鱼"字出现频繁,但"金鱼""鱼袋""鱼轩"为服饰用语,"鱼鳖"等非服饰
- 行号基于原文件行号,格式为L+行号