《赤崁集》服饰内容提取 · 对话记录
时间:2026-04-19 任务ID: batch5-2 任务:提取《赤崁集》全部服饰相关内容,整理分类总结
操作流程
Step 0: 检查文件与创建目录
wc -l 赤崁集.txt → 1316行
mkdir -p 四库别集output/赤崁集/
Step 1: 读取参考文件
读取 参考目录下三文件:总结.md、日志.md、原文提取.md
→ 确定输出格式:总结(分类汇编+表格)、日志(操作流程+关键发现)、原文提取(按类列原文)
Step 2: 读取源文件首50行
赤崁集,清·孙元衡撰,四卷诗集(卷一乙酉、卷二丙戌、卷三丁亥、卷四戊子)
为官台湾时所作,内容以台地山川风物为主
Step 3: 第一轮grep——服饰大类关键词
grep -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐" → 45条匹配
grep -n "衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁" → 大量匹配(含非服饰用词如"丝"指蛛丝等)
grep -n "素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗" → 极多匹配(大部分为景物描写)
过滤策略:颜色词(赤青黄白黑朱紫翠金银玉珠)在诗集中绝大多数用于写景咏物,仅保留与服饰明确搭配者。
Step 4: 第二轮grep——精准服饰词组
grep -n "赐衣|衣冠|冠冕|青袍|青衫|白罗裳|衫子|罗衣|朱履|华衮|佩纕|毳衣|风裳|葛巾|文身|服妖|桶裠|裸|雕题|黑齿" → 31条核心匹配
grep -n "衣裳|衣衾|莱衣|被衣|素衣|云衣|蛇衣|袍|裘|褐|冠|弁|巾|帽|履|屩|屐|靴|袜" → 36条匹配
Step 5: 第三轮grep——补充搜索
grep -n "簪|钗|步摇|绶|笏|蟒|补服|幞头|乌纱|进贤冠|深衣|大带|蔽膝|霞帔|翟衣|蚕服|舆服|章服|朝服|公服|丧服|戎服" → 5条匹配(簪4条、蟒1条用于蛇名)
→ 结论:本书无传统舆服制度内容(无朝服/祭服/丧服/品服等记载)
grep -n "章甫|绣肌|纹身|文蛇|绮罗|缁|缟|裹头|巾|笠" → 13条匹配
grep -n "裙|罗衣|集裳|银鞍|锦鞍|金甲|甲冑|短布|幅布|蚕|织|染" → 20条匹配
Step 6: 逐行审读与分类
逐一审读所有匹配行,排除以下噪音:
- "丝"指蛛丝、雨丝(如"银丝""霜丝")→ 排除
- "冠"用于"冠绝""冠军"等非服饰义 → 排除
- "带"用于"钩带""地带"等非服饰义 → 排除
- "罗"用于"网罗""星罗"等 → 排除
- 颜色词用于自然景物(青山、白云、黄金等)→ 排除
- "织"用于"织愁"等比喻义 → 排除
- "染"用于"染丝"为典故引用 → 保留
Step 7: 分类归纳
最终确定6大类:
- 台湾原住民服饰习俗(10个子项)——全书最核心服饰内容
- 官员士人服饰(8个子项)
- 日常与文人服饰(5个子项)
- 文学典故中的服饰意象(6个子项)
- 装饰品(4个子项)
- 纺织材料与染色(4个子项)
Step 8: 写3个MD文件
- 总结.md(分类汇编+总结表格)
- 日志.md(本文件)
- 原文提取.md(按类列原文及行号)
关键发现
- 《裸人丛笑篇》十五首是清代台湾原住民服饰最重要的诗体民族志——涵盖裸体、文身、雕题黑齿、桶裙、大耳竹筒、束腰、璎珞、戴笠等,渔洋先生评其"可作裸人风土记,自为一书"
- "服妖"为全诗服饰核心概念——"台人服多不衷"是诗题,"服妖今已被文身"是结论
- 冠服等级的两种形态——中原"冠冕定崇卑"vs原住民"酋长加以冠,族类裸其躬"
- 台地奢俗突出——"衣罗衣、着朱履而耘田""绮罗朝入市,负戴夜还家"
- 本书无传统舆服制度——无朝服/祭服/品服/舆服志式记载,服饰内容全部散见于诗作
- 作者服饰自述——"未典年来两赐衣""青袍蚤已任升沈""束带着青袍"为低级官员服饰实录
关键踩坑记录
- "丝"在诗集中出现频率极高,但大多指雨丝、蛛丝、银丝(白发),非纺织品,需逐一过滤
- "冠"出现28次,但"冠军""冠绝""冠平生"等占一半以上,需区分帽冠义与冠军义
- "带"多用于"钩带""地带""带雨"等,衣带义仅"束带""冠带"数处
- "罗"多用于"网罗""星罗""遮罗",丝罗义仅"白罗裳""罗衣""绮罗"数处
- 颜色词(青白朱紫金银等)海量出现但99%为景物描写,仅保留明确与服饰搭配者
审核结果
全部通过 ✅ — 原文均从源文件grep提取,有明确行号对应,噪音已逐条过滤。