《读书斋偶存稿》服饰内容提取 · 操作日志
时间:2026-04-24 任务:提取《读书斋偶存稿》全部服饰相关内容,整理分类总结 任务ID:batch2-2
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/读书斋偶存稿/
成功
Step 2: 读取参考模板
读取 /home/z/my-project/upload/参考/ 总结.md、日志.md、原文提取.md
三份模板已读取,格式要求明确:
- 总结.md:分类综述 + 学术审查
- 日志.md:完整操作记录
- 原文提取.md:带行号的原始片段
Step 3: 查看源文件基本信息
wc -l 读书斋偶存稿.txt → 1229行
文件不大,但遵守规则不全文载入上下文。
Step 4: 第一轮grep搜索 — 衣裳裘冠冕弁帻巾帽袍衫裙裤
grep -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤" 读书斋偶存稿.txt
结果:约80+行命中,涵盖衮衣、冕旒、冠簮、麻衣席帽、青衫、袍袖等
Step 5: 第二轮grep搜索 — 褐衮绶佩笏带锦绮绢帛丝绸缎绫罗纱绉缟缁素
grep -n "褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁|素" 读书斋偶存稿.txt
结果:约100+行命中,但大量为"丝"(丝线、蚕丝比喻)、"素"(素心、素书等非服饰用法)
Step 6: 第三轮grep搜索 — 赤青黄白黑朱紫绯绿翠金银玉珠簪钗钿珥
grep -n "赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥" 读书斋偶存稿.txt
结果:约200+行命中,噪音极大。颜色词和金银玉珠多为非服饰用法(如"黄金""白玉""朱霞"等)。
Step 7: 精准搜索 — 服饰专有名词
grep -n "衮衣|冕旒|冠簮|缙笏|垂绅|朝衣|宫衣|青衫|绨袍|布衣|麻衣|锦袍|轻裘|半臂|禅衣|丝帻|葛巾|葛帔|乌衣|惠文冠|貂|袍|铁衣|翎|舄|履|纶巾|角巾|冠缨|脱帽|落帽|衣间"
grep -n "释褐|簪笔|珥笔|白笔|簮|冠裳|衣冠|衣鉢|拂衣|披衣|拥衣|裂裳|裁衣|衣簏|衣袂|春衣|素衣|黄绶|紫衣|翠袖|罗衣|罗裳|红衣|荷衣|薜衣"
结果:精准确认了约50+行含真实服饰内容的行。
Step 8: 筛选过滤噪音
排除以下非服饰匹配:
- "红衣冉冉时"(荷花,L119)
- "翠盖亭亭立"(荷叶,L119)
- "朱轮"(车轮,L148)
- "黄金屋""白玉堂"(建筑比喻,L1064)
- "丝"作蚕丝/丝线比喻者(多行)
- "素"作"素心""素书"等非服饰用法者
- "衣鉢"保留但注明为佛门传法象征
Step 9: 分类整理
将确认的服饰内容分为8大类:
- 朝服与官服(衮衣、冕旒、垂绅、朝衣、朝绅)
- 官员服制与佩饰(缙笏、簮笏、白笔簮、珥笔、惠文冠、黄绶、银鱼、金貂)
- 释褐与科第服饰(释褐、麻衣席帽、青衫、青袍)
- 赐服与军事服饰(麒麟袍、轻裘缓带、兕甲、铁衣)
- 隐逸与文人服饰(布衣、被褐、篛笠荷衣、葛帔绡巾、葛巾、纶巾、角巾、拂衣)
- 女性服饰(宫衣、罗衣、罗裳、翠钿、翠袖、紫电裙)
- 特殊服饰与典故(半臂绫、绨袍、裦衣、逢掖、岑牟单绞、禅衣丝帻、黄冠、紫衣僧、冠裳之徒)
- 丝织品名物(吴绫、红锦、白绢、黼黻)
Step 10: 撰写3个MD文件
- 读书斋偶存稿_总结.md:8大类结构化综述 + 学术审查
- 读书斋偶存稿_日志.md:本文件,完整操作记录
- 读书斋偶存稿_原文提取.md:带行号的原始服饰匹配片段
关键发现
- 本书为诗集,服饰内容均为文学化表达:无制度性服饰记载,所有服饰描写均嵌于诗歌语境
- 清初官场服饰的文学映射:青衫、青袍、黄绶反复出现,折射清初汉臣官阶低微的现实
- 隐逸vs出仕的服饰二元对立:荷衣/朝绅、布衣/冠裳、葛巾/簮笏构成诗歌核心意象
- 赐服制度记录:麒麟袍、金貂为清初功臣封赏制度提供诗歌佐证
- 典故服饰密集:绨袍(范睢)、半臂绫(宋祁)、岑牟单绞(祢衡)、禅衣丝帻(东方朔)等
- 释褐记载:卷首提要明确记载叶方蔼"释褐后即以文章受知",为科举服饰术语的原始用例
关键踩坑记录
- 颜色词搜索噪音极大:赤/青/黄/白/黑/朱/紫/金/银/玉/珠等词在诗歌中出现频率极高,绝大多数为非服饰用法
- "衣"字搜索需配合语境判断:如"红衣"指荷花、"衣冠"有时指礼仪而非实物、"衣鉢"为传法象征
- "丝""素"等词在诗集中大量用作比喻(丝线、素心),需人工过滤
- 部分服饰典故需考证:如"岑牟单绞"为祢衡击鼓典故,"禅衣丝帻"为东方朔典故
审核结果
全部通过 ✅ — 原文均从源文件grep -n提取,有明确行号对应,噪音已人工过滤。