《迪功集》服饰内容提取 · 工作日志
任务ID: batch6-4 时间:2026-04-18 操作人:AI古籍整理助手
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/迪功集/
- 输入文件:/home/z/my-project/upload/四库别集/迪功集.txt
- 文件规模:887行,82,962字节
- 参考模板:总结.md / 日志.md / 原文提取.md
Step 2: 读取参考文件
- 读取 /home/z/my-project/upload/参考/ 下三个MD模板
- 确认格式规范:总结=分类汇编,日志=操作记录,原文=逐条提取
Step 3: grep多轮搜索
第一轮:基础服饰词
grep -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐" 迪功集.txt
→ 命中43行
第二轮:材质色名词
grep -n "衮|绶|佩|笏|带|锦|绮|绢|帛|丝绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑|朱|紫|绯|绿|翠" 迪功集.txt
→ 命中大量行,含大量非服饰用法(颜色、地名等),需人工过滤
第三轮:高优组合词
grep -n "金|银|玉|珠|簪|钗|钿|珥|步摇|冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服" 迪功集.txt
→ 命中行数与第二轮重叠,无系统性舆服制度内容
第四轮:特定面料与典故词
grep -n "纩|絺|狐|貉|貂|纨|绨|袍|裈|襦|襁|裙|缨|舄|韎|韐|羔裘|鹔鹴|鹿皮|碧云裘|黑裘|紫云裘|缁素裳|衮裳" 迪功集.txt
→ 精准命中关键服饰典故
第五轮:丝织与纺织词
grep -n "白纻|罗绮|縠|蚕|桑|丝|绣|裾|衾|缟|纱|绶|笏|佩|组|绁|纁" 迪功集.txt
→ 补充纺织材料条目
Step 4: 过滤噪音
过滤以下类型:
- 颜色非服饰用法:青山、白云、黄鹄、白璧等非服饰语境
- 地名:锦水、锦屏(地名)、紫微(星宿)
- 植物:桑叶、桑柘(非蚕桑制度)
- 器物:锦嚢(装物用)、锦灯(灯具)
- 抽象概念:青云、紫气、翠羽(鸟羽非饰物)
Step 5: 分类整理
按8大类整理:
- 冕服与朝服制度(4条)
- 裘服与冬衣(7条)
- 冠帽(11条)
- 袍服与衣裳(8条)
- 丝织品与纺织材料(9条)
- 佩饰与配件(6条)
- 履舄与足服(3条)
- 礼制服饰概念(4条)
Step 6: 输出文件
| 文件 | 大小 | 说明 |
|---|---|---|
| 总结.md | ~6KB | 分类总结表 |
| 日志.md | ~4KB | 本文件 |
| 原文提取.md | ~8KB | 逐条原文 |
关键发现
- 《迪功集》为诗文别集,无系统性服饰制度记载
- 服饰内容全为诗歌意象与典故,非纪实描写
- 裘服等级呈现鲜明:紫云裘(天子)→紫貂(贵官)→黑裘(寒士)→羊裘(隐士)
- 白纻歌为南朝乐府传统,反映南方苎麻布文化
- 朝服用语(衮旒、华虫、黼黻、韎韐)全出经典,非明代实录
- 隐士服饰符号系统:羊裘+角巾+鹿皮冠=隐逸三联
- 狐貉非所宜、怀纩犹抱絺反映南北气候差异与服饰适应性
- 蚕桑丝织描写集中于江南题材,体现吴地经济特征
踩坑记录
- "罗""素""白"等颜色字大量出现在非服饰语境,必须逐行过滤
- "锦屏"在本书中为地名非织物
- "翠羽"为鸟羽描写非头饰
- "桑"多指桑树而非蚕桑制度
- "赤"多指赤色修饰语非赤色服饰