《近光集》服饰内容提取 · 操作日志

任务ID:batch6-1 时间:2026-03-05 输入:/home/z/my-project/upload/四库别集/近光集.txt(835行) 输出:/home/z/my-project/upload/四库别集output/近光集/


操作流程

Step 1: 环境准备

mkdir -p /home/z/my-project/upload/四库别集output/近光集
wc -l 近光集.txt → 835行(小型集子,但严禁整本载入)

Step 2: 读取参考模板

读取 参考/总结.md、参考/日志.md、参考/原文提取.md
→ 总结:分类表+核心发现+总结
→ 日志:步骤+关键发现+踩坑
→ 原文:按类提取原文,标注行号

Step 3: grep多轮搜索

第1轮:基础服饰词(衣/裳/裘/冠/冕/弁/帻/巾/帽/袍/衫/裙/裤/褐) → 命中约80行,含大量噪音(如"衣冠"泛指、"衣"为穿衣动词)

第2轮:织物/材质词(衮/绶/佩/笏/带/锦/绮/绢/帛/丝/绸/缎/绫/罗/纱/绉/缟/缁/素) → 命中约70行,"丝/素"噪音较多("丝"常见于"丝纶"等非服饰语境)

第3轮:颜色/饰品词(赤/青/黄/白/黑/朱/紫/绯/绿/翠/金/银/玉/珠/簪/钗/钿/珥/步摇) → 命中约90行,颜色词噪音极大("青天""白云"等非服饰用法),需严格过滤

第4轮:复合服饰词(冠服/舆服/章服/朝服/公服/祭服/丧服/常服/戎服/赐服/蟒衣/飞鱼/斗牛/补服/品色/鱼袋/革带/玉带/金带/幞头/乌纱/进贤冠/深衣/大带/蔽膝/舄/履/靴/袜/霞帔/翟衣/蚕服) → 仅命中3行:佩金鱼服(行339)、赤舄(行367)、素服(行332) → 结论:本书无明清理学化的冠服制度术语,服饰描写以诗化语言为主

第5轮:特殊赐服词(济逊/诈马/一色衣/对衣/貂裘/赐衣/赐袍/恩袍/绣衣/紫衣/金织/衮衣/衮旒/龙衣/步障/金带/玉带/斑衣/衣冠/衣币) → 命中约40行,精准度高

第6轮:冠冕佩绶词(冠/冕/弁/幞头/乌纱/进贤/深衣/大带/佩/绶/笏/鱼袋/补服) → 命中约30行,含"冠"字泛指噪音

第7轮:纺织品/配饰(罗衣/罗绮/步障/锦/绣/纱/绡/绮/缃/氷绡/貂/珰/簪/缨/珩/旒/璪/鞓/鞶) → 命中约50行

Step 4: 过滤噪音

剔除规则

保留规则

Step 5: 分类整理

按7类归纳:

  1. 济逊宴服制(1条核心+详文)
  2. 天子朝祭服饰(6条)
  3. 赐服制度(6条核心)
  4. 官服佩饰(11条)
  5. 日常文人服饰(9条)
  6. 纺织品与装饰(8条)
  7. 异族外国服饰(3条)

Step 6: 写出3个MD文件


关键发现

  1. 济逊宴"一色衣"为本书最大服饰史料:诈马行序+正文详细记录了元代独有赐服制度,"佩服日一易"为极珍贵的制度细节
  2. 赐服为全书核心主题:周伯琦作为近臣,5年间受赐衣币、金织对衣、青貂裘、绣衣材等,记录完整
  3. "紫衣舍人掌礼借紫衣金带"自注:揭示元代借服制度
  4. 佛郎国使臣"服二色窄衣":元代中西交流的珍贵服饰记载
  5. 无系统性冠服制度描述:全书为诗文别集,服饰信息散见于诗句,需结合语境提取

踩坑记录