《道园遗稿》服饰内容提取 · 操作日志
时间:2026-04-20 任务:提取《道园遗稿》全部服饰相关内容,整理分类总结 任务ID:batch7-5
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/道园遗稿/
wc -l 道园遗稿.txt → 1465行
Step 2: 读取参考文件
- 参考/总结.md → 吕氏春秋服饰总结(分类+表格+核心思想)
- 参考/日志.md → 晋会要提取日志(流程+发现+踩坑)
- 参考/原文提取.md → 天工开物原文提取(分类编排+原文引用)
Step 3: grep多轮搜索(5轮)
第1轮:核心服饰词
grep -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫' → 112行
grep -n '裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛' → 91行
第2轮:颜色与材质
grep -n '丝绸|缎|绫|罗|纱|绉|缟|缁|素|赤|青|黄|白|黑' → 310行(噪音极大)
grep -n '朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇' → 311行(噪音极大)
第3轮:复合关键词(精确匹配)
grep -n '冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服' → 32行
第4轮:具体服饰名词
grep -n '束带|缓带|玉带|金带|锦衣|朝衣|宫袍|紫衫|青衫|白苎|布衣|五铢衣|羽衣|衮|章服' → 命中
grep -n '乌帽|貂裘|银鼠|绣袍|冠缨|冠佩|黄冠|儒冠|豸角冠|簪缨|簪绅|簪笏|簪笔|珥貂|翠袖|朱衣|步摇' → 命中
第5轮:织物与部件
grep -n '白毡|氍毹|锦韝|绒|缣|纩|绡|罗袜|裙|绶|襦|袂|襟|领|袖' → 补充提取
Step 4: sed提取关键行
sed -n '56,57p' → 东坡戴履图(朝衣、笠、屐)
sed -n '187,188p' → 古铜带钩剑琫歌(佩饰)
sed -n '192p' → 金人出塞图(绣袍、锦韝、氍毹)
sed -n '265p' → 紫衫束带帽正乌
sed -n '434p' → 中原不改汉衣冠
sed -n '662,663p' → 止家人制衣(布单衣)
sed -n '1072p' → 白毡裁成鹤氅衣
sed -n '1119p' → 制个新袍似日红
sed -n '1331p' → 银鼠为裘
Step 5: 过滤噪音
- 单字"衣""冠"等大量出现在非服饰语境(如"衣冠"作抽象词、"冠"作动词"冠绝")
- "紫""翠""金""玉"等颜色字大量作景物描写非服饰
- 过滤原则:仅保留明确描写服饰穿着、织物材质、佩饰器物、冠服制度的条目
- 有效条目:约55处(从原始856行匹配中筛选)
Step 6: 分类整理
7大类:
- 官服与朝仪(8小项)
- 冠帽与头饰(9小项)
- 衣裘与日常服饰(14小项)
- 佩饰与器物(9小项)
- 织物(10小项)
- 冠服与政治象征(8小项)
- 道教与仙侠服饰(12小项)
Step 7: 保存三份文件
- 总结.md(7,842字)← 分类总结+表格+核心发现
- 原文提取.md(9,156字)← 原文引录+行号+分类编排
- 日志.md(本文件)
关键发现
- "中原不改汉衣冠"为全书最重要的服饰政治意象——行434,体现元代南人故国之思
- 道教仙服描写最为丰富——五铢衣、羽衣、鹤氅、月帔星冠等构成完整仙人服饰谱系
- "紫衫束带帽正乌"为元代文臣朝见真实写照——行265,记录明光殿进书时服饰
- 白苎衣为隐逸文化符号——5次出现,与束带官服形成仕/隐对照
- 裘服反映北方生活——貂裘、银鼠裘、衣裘薄,体现元代北方气候
- 古铜带钩为珍贵佩饰考证——行187-188,详述带钩形制与佩剑关系
- "冠带衣裳明日月"为礼乐文明象征——行716,以冠带衣裳代表华夏制度
踩坑记录
- 单字关键词噪音极大:"衣""冠""带""佩"等单字在诗文中出现频率极高,大量为非服饰用法("衣"作动词"衣之"、"冠"作动词"冠绝")
- "紫""翠""金""玉"等颜色词泛滥:310+行匹配,90%为景物描写,需逐条人工判断
- 本书无专章论述服饰:与《晋会要》有舆服专卷不同,《道园遗稿》为诗文别集,服饰仅散见于意象
- 道教服饰需甄别:五铢衣、羽衣等虽为服饰描写,实为修仙意象,非现实穿着
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应,过滤后55处有效条目分类清晰。