《近光集》服饰内容提取 · 操作日志
任务ID:batch6-1 时间:2026-03-05 输入:/home/z/my-project/upload/四库别集/近光集.txt(835行) 输出:/home/z/my-project/upload/四库别集output/近光集/
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/近光集
wc -l 近光集.txt → 835行(小型集子,但严禁整本载入)
Step 2: 读取参考模板
读取 参考/总结.md、参考/日志.md、参考/原文提取.md
→ 总结:分类表+核心发现+总结
→ 日志:步骤+关键发现+踩坑
→ 原文:按类提取原文,标注行号
Step 3: grep多轮搜索
第1轮:基础服饰词(衣/裳/裘/冠/冕/弁/帻/巾/帽/袍/衫/裙/裤/褐) → 命中约80行,含大量噪音(如"衣冠"泛指、"衣"为穿衣动词)
第2轮:织物/材质词(衮/绶/佩/笏/带/锦/绮/绢/帛/丝/绸/缎/绫/罗/纱/绉/缟/缁/素) → 命中约70行,"丝/素"噪音较多("丝"常见于"丝纶"等非服饰语境)
第3轮:颜色/饰品词(赤/青/黄/白/黑/朱/紫/绯/绿/翠/金/银/玉/珠/簪/钗/钿/珥/步摇) → 命中约90行,颜色词噪音极大("青天""白云"等非服饰用法),需严格过滤
第4轮:复合服饰词(冠服/舆服/章服/朝服/公服/祭服/丧服/常服/戎服/赐服/蟒衣/飞鱼/斗牛/补服/品色/鱼袋/革带/玉带/金带/幞头/乌纱/进贤冠/深衣/大带/蔽膝/舄/履/靴/袜/霞帔/翟衣/蚕服) → 仅命中3行:佩金鱼服(行339)、赤舄(行367)、素服(行332) → 结论:本书无明清理学化的冠服制度术语,服饰描写以诗化语言为主
第5轮:特殊赐服词(济逊/诈马/一色衣/对衣/貂裘/赐衣/赐袍/恩袍/绣衣/紫衣/金织/衮衣/衮旒/龙衣/步障/金带/玉带/斑衣/衣冠/衣币) → 命中约40行,精准度高
第6轮:冠冕佩绶词(冠/冕/弁/幞头/乌纱/进贤/深衣/大带/佩/绶/笏/鱼袋/补服) → 命中约30行,含"冠"字泛指噪音
第7轮:纺织品/配饰(罗衣/罗绮/步障/锦/绣/纱/绡/绮/缃/氷绡/貂/珰/簪/缨/珩/旒/璪/鞓/鞶) → 命中约50行
Step 4: 过滤噪音
剔除规则:
- "衣"作动词("衣频减""不衣裘"除外,有服饰参考价值)
- 颜色修饰非服饰对象("青山""碧水""白昼"等)
- "丝"用于"丝纶""丝桐"(指琴弦/诏令)
- "素"用于"素心""素餐"等抽象用法
- "冠"用于地名/人名("冠山""冠云穹"中"冠"作动词保留)
保留规则:
- 泛指"衣冠"有制度含义者保留
- 诗中服饰描写虽为文学修辞,但有服饰史料价值者保留
- 自注中服饰信息特别保留
Step 5: 分类整理
按7类归纳:
- 济逊宴服制(1条核心+详文)
- 天子朝祭服饰(6条)
- 赐服制度(6条核心)
- 官服佩饰(11条)
- 日常文人服饰(9条)
- 纺织品与装饰(8条)
- 异族外国服饰(3条)
Step 6: 写出3个MD文件
- 总结.md(本文件):分类表+核心发现+总结
- 日志.md(本文件):操作流程+关键发现+踩坑记录
- 原文提取.md:按类提取原文,标注行号
关键发现
- 济逊宴"一色衣"为本书最大服饰史料:诈马行序+正文详细记录了元代独有赐服制度,"佩服日一易"为极珍贵的制度细节
- 赐服为全书核心主题:周伯琦作为近臣,5年间受赐衣币、金织对衣、青貂裘、绣衣材等,记录完整
- "紫衣舍人掌礼借紫衣金带"自注:揭示元代借服制度
- 佛郎国使臣"服二色窄衣":元代中西交流的珍贵服饰记载
- 无系统性冠服制度描述:全书为诗文别集,服饰信息散见于诗句,需结合语境提取
踩坑记录
- "衣冠"在本书中出现频繁,但多为泛指"官员/士大夫",非具体服饰描写,需区别对待
- 颜色词(青/白/赤/朱/紫等)噪音极多,诗中大量写景用色,与服饰无关
- "金""玉""珠"等材质词同样大量用于建筑/器物描写,需结合上下文判断
- "冠"字兼有名词(帽子)和动词(居首)两种用法,"冠云穹""冠山"属后者
- 第4轮复合服饰词命中率极低,反映元代诗文别集不使用明清理学化的服制术语
- 行25(自序)包含密集赐服信息,但整段极长,需单独提取关键句