《郑板桥集》服饰内容提取 · 日志
时间:2026-04-19 任务ID:batch9-1 操作人:AI agent
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/郑板桥集
Step 2: 读取参考文件
参考/总结.md → 吕氏春秋总结模板(分类+表格+核心思想)
参考/日志.md → 晋会要日志模板(操作流程+关键发现+踩坑记录)
参考/原文提取.md → 天工开物原文模板(按主题分类+行号标注)
Step 3: 文件基本信息
文件:/home/z/my-project/upload/四库别集/郑板桥集.txt
大小:252,465 字节
行数:2,407 行
类型:清·郑燮诗文集(诗、词、道情、题画、家书、序跋、碑文)
Step 4: Grep多轮搜索
第1轮:基础服饰词(衣裳/裘/冠/冕/弁/帻/巾/帽/袍/衫/裙/裤/褐) → 命中约80行,含大量文学性用例
第2轮:织物与配饰词(衮/绶/佩/笏/带/锦/绮/绢/帛/丝/绸/缎/绫/罗/纱/绉/缟/缁/素) → 命中约60行,"丝""锦""罗"高频但多为比喻修辞
第3轮:颜色与饰物词(赤/青/黄/白/黑/朱/紫/绯/绿/翠/金/银/玉/珠/簪/钗/钿/珥/步摇) → 命中约100行,大量非服饰用法需过滤
第4轮:制度性服饰词(冠服/舆服/章服/朝服/公服/祭服/丧服/蟒衣/补服/幞头/乌纱/深衣/大带/靴/袜/霞帔等) → 命中6行,确认本书无系统性服饰制度记载
第5轮:描述性服饰词(水田衣/宫锦/布衣/青衫/短褐/鹑衣/红裙/翠袖等) → 命中约50行,核心内容区
第6轮:补充搜索(衲衣/方袍/白刃/朱袍/麻衣/菱花镜/泥金箱/花钿/服饰/宫花等) → 命中约20行,补充细节
Step 5: 噪音过滤
过滤规则:
- "丝"作"丝竹""丝管"(乐器义)→ 排除
- "罗"作"星罗"→ 排除
- "锦"作"锦互""锦纹"(非服饰义)→ 排除
- "金""银""玉""珠"非服饰用法(如"金樽""银沙""玉勾")→ 排除
- "素"作"素质""素心"(非缟素义)→ 排除
- "衣"作"衣钵""穿衣戴帽"中之"穿衣"→ 保留(社会风俗)
Step 6: 分类整理
按8大主题分类:
- 官服与仕途象征(乌纱/朝衫/宫袍/袍笏)
- 贫富服饰对比(破裘/短褐/鹑衣 vs 貂裘/罗绮/锦茵)
- 女性服饰与首饰(红裙/罗裙/翠翘/簪珥/花钿)
- 纺织与衣料(缫丝/鹅溪绢/棉绸)
- 道释服饰与隐逸(衲衣/水田衣/方袍/麻衣)
- 丧葬与礼制服饰(衣冠葬/冕旒/白褂)
- 军事与边塞服饰(黄皮裤/破羊裘/破甲)
- 风俗与时尚(穿衣戴帽/银冠假珠/时兴打扮)
Step 7: 写出3个MD
| 文件 | 内容 | 大小 |
|---|---|---|
| 总结.md | 分类总结+表格+核心发现 | ~7KB |
| 原文提取.md | 按主题分节,标注行号,引原文 | ~8KB |
| 日志.md | 本文件,操作流程+发现+踩坑 | ~4KB |
关键发现
- "乌纱"是全书最核心的服饰意象:5次出现构成完整的仕途心路轨迹(不爱→变心→掷去→困守)
- 贫富对比是服饰书写的第一主题:罗绮/布褐、紫裘/破衣、锦茵/饥寒的反复对比
- 无任何制度性服饰记载:与《晋会要》《天工开物》等不同,本书纯属文学性服饰描写
- 清代中叶民间服饰风尚有珍贵记录:学京师穿衣戴帽、仿姑苏时兴打扮、银冠钉假珠
- **"水田衣"**为明代以来僧道常服,道情中描写道人形象完整(水田衣+袱巾+棕鞋布袜)
- **"宫绸裌套""白里外褂"**为清代官场实用服饰的罕见记录
- **"脱簪典旧衣"**反映贫士家庭的真实窘境
- **方孝孺"竹杖麻衣,朱袍白刃"**为板桥对明初忠臣的服饰想象
关键踩坑记录
- "丝"字出现频率极高,但90%为"丝竹""丝管""丝桐"等乐器义或"丝网""一丝一粒"等量词义,需严格过滤
- "罗"在"罗衾""罗帏"中指帐幔非裙裳,但在"遍身罗绮"中确指织物,需区分
- "素"几乎全为"素质""素心""素餐"等非服饰义,无"缟素"丧服用法
- 行1743与行2000为同一故事的重复版本(板桥自叙的两个版本),服饰内容一致
- 行1635/1985、行1637/1987为重复引用张俞《蚕妇》诗,属同一内容
审核结果
全部通过 ✅ — 原文均从TXT文件grep提取,有明确行号对应。无虚构内容。