研究总结 日志 原文

《刘铭传抚台前后档案》服饰内容提取 · 处理日志

时间:2026-05-05 任务:提取《刘铭传抚台前后档案》全部服饰相关内容,整理分类总结


操作流程

Step 0: 创建输出目录

mkdir -p /root/.openclaw/workspace/诏令奏议output/刘铭传抚台前后档案/

Step 1: 检查文件大小

wc -c /root/.openclaw/workspace/诏令奏议/001/刘铭传抚台前后档案.txt
→ 447652 bytes (447KB)
→ 未超500KB阈值,但仍用grep+sed提取,严禁整本载入

Step 2: 初次grep(宽泛关键词)

grep -n "舆服\|冠\|冕\|袍\|绶\|朝服\|祭服\|公服\|服色\|章服\|戎服\|赐紫\|赐绯\|衣\|裳\|裘\|帛\|锦\|绣\|丝\|绢\|绫\|罗\|缎\|褐\|布\|染\|色\|带\|佩\|笏\|靴\|履\|帽\|巾\|帻\|簪\|钗\|首饰\|服饰\|车服\|冕服\|法服\|冠服\|品服\|命服\|丧服\|婚礼\|昏服"
→ 166条结果

问题:大量噪音——

Step 3: 精确grep(二次筛选)

grep -n "衣裤\|衣裳\|薙发\|剃发\|易服\|变服\|辫线\|蓝布\|哔叽\|赏给.*衣\|赏给.*裤\|衣、裤\|蟒袍\|顶戴\|赏加\|黄马褂\|朝珠\|补服\|翎枝\|花翎\|蓝翎\|红顶\|顶子\|品服\|冠服\|衣冠\|军装\|号衣\|号褂\|制服\|军服\|皮冠\|帽\|靴\|袜\|鞋\|袍\|褂\|裘\|缎\|绸\|锦\|绣\|染"
→ 进一步筛选出有效段落

Step 4: 提取上下文并验证

对关键段落用sed提取前后5-10行上下文,确认原文存在并标注行号。

关键段落识别

Step 5: 去噪结果

保留的有效段落

  1. 薙发易服制度(抚番善后章程、各处招抚实例)
  2. 赏番衣裤(蓝布衫、红哔叽裤腿、春秋衣裤)
  3. 抚番赏赐中的纺织品(布疋)
  4. 军功赏赐服饰(黄马褂、花翎、顶戴)
  5. 番目功牌制度

排除的噪音

Step 6: 产出三份文档


关键发现

  1. 本书无传统舆服制度记载:全书为晚清台湾治台公文,无冕服、朝服、祭服等内容
  2. 服饰内容集中于"薙发易服":这是清代治台抚番政策的核心标志
  3. 赏番衣裤已制度化:社长春秋衣裤年发两次,有明确的规模和流程
  4. 蓝布衫、红哔叽裤腿为标准赏番服饰:光绪十二年嘉义县招抚实例
  5. 军功服饰赏赐(黄马褂、花翎)出现于上谕中:为攻克番社后的论功行赏
  6. 功牌制度与服饰相关:番目归化一年不滋事者给六七品功牌

审核结果

全部通过 ✅ — 原文均从原文件中grep+sed提取,有明确行号对应。