《赤崁集》服饰内容提取 · 对话记录

时间:2026-04-19 任务ID: batch5-2 任务:提取《赤崁集》全部服饰相关内容,整理分类总结


操作流程

Step 0: 检查文件与创建目录

wc -l 赤崁集.txt → 1316行
mkdir -p 四库别集output/赤崁集/

Step 1: 读取参考文件

读取 参考目录下三文件:总结.md、日志.md、原文提取.md
→ 确定输出格式:总结(分类汇编+表格)、日志(操作流程+关键发现)、原文提取(按类列原文)

Step 2: 读取源文件首50行

赤崁集,清·孙元衡撰,四卷诗集(卷一乙酉、卷二丙戌、卷三丁亥、卷四戊子)
为官台湾时所作,内容以台地山川风物为主

Step 3: 第一轮grep——服饰大类关键词

grep -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐" → 45条匹配
grep -n "衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁" → 大量匹配(含非服饰用词如"丝"指蛛丝等)
grep -n "素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗" → 极多匹配(大部分为景物描写)

过滤策略:颜色词(赤青黄白黑朱紫翠金银玉珠)在诗集中绝大多数用于写景咏物,仅保留与服饰明确搭配者。

Step 4: 第二轮grep——精准服饰词组

grep -n "赐衣|衣冠|冠冕|青袍|青衫|白罗裳|衫子|罗衣|朱履|华衮|佩纕|毳衣|风裳|葛巾|文身|服妖|桶裠|裸|雕题|黑齿" → 31条核心匹配
grep -n "衣裳|衣衾|莱衣|被衣|素衣|云衣|蛇衣|袍|裘|褐|冠|弁|巾|帽|履|屩|屐|靴|袜" → 36条匹配

Step 5: 第三轮grep——补充搜索

grep -n "簪|钗|步摇|绶|笏|蟒|补服|幞头|乌纱|进贤冠|深衣|大带|蔽膝|霞帔|翟衣|蚕服|舆服|章服|朝服|公服|丧服|戎服" → 5条匹配(簪4条、蟒1条用于蛇名)
→ 结论:本书无传统舆服制度内容(无朝服/祭服/丧服/品服等记载)
grep -n "章甫|绣肌|纹身|文蛇|绮罗|缁|缟|裹头|巾|笠" → 13条匹配
grep -n "裙|罗衣|集裳|银鞍|锦鞍|金甲|甲冑|短布|幅布|蚕|织|染" → 20条匹配

Step 6: 逐行审读与分类

逐一审读所有匹配行,排除以下噪音:
- "丝"指蛛丝、雨丝(如"银丝""霜丝")→ 排除
- "冠"用于"冠绝""冠军"等非服饰义 → 排除
- "带"用于"钩带""地带"等非服饰义 → 排除
- "罗"用于"网罗""星罗"等 → 排除
- 颜色词用于自然景物(青山、白云、黄金等)→ 排除
- "织"用于"织愁"等比喻义 → 排除
- "染"用于"染丝"为典故引用 → 保留

Step 7: 分类归纳

最终确定6大类:

  1. 台湾原住民服饰习俗(10个子项)——全书最核心服饰内容
  2. 官员士人服饰(8个子项)
  3. 日常与文人服饰(5个子项)
  4. 文学典故中的服饰意象(6个子项)
  5. 装饰品(4个子项)
  6. 纺织材料与染色(4个子项)

Step 8: 写3个MD文件


关键发现

  1. 《裸人丛笑篇》十五首是清代台湾原住民服饰最重要的诗体民族志——涵盖裸体、文身、雕题黑齿、桶裙、大耳竹筒、束腰、璎珞、戴笠等,渔洋先生评其"可作裸人风土记,自为一书"
  2. "服妖"为全诗服饰核心概念——"台人服多不衷"是诗题,"服妖今已被文身"是结论
  3. 冠服等级的两种形态——中原"冠冕定崇卑"vs原住民"酋长加以冠,族类裸其躬"
  4. 台地奢俗突出——"衣罗衣、着朱履而耘田""绮罗朝入市,负戴夜还家"
  5. 本书无传统舆服制度——无朝服/祭服/品服/舆服志式记载,服饰内容全部散见于诗作
  6. 作者服饰自述——"未典年来两赐衣""青袍蚤已任升沈""束带着青袍"为低级官员服饰实录

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从源文件grep提取,有明确行号对应,噪音已逐条过滤。