研究总结 日志 原文

《台湾采访册》服饰内容提取 — 操作日志

操作时间:2026-05-04 00:16-00:30 操作者:AI Agent(子代理)


操作流程

Step 1: 确认文件信息

文件路径:/root/.openclaw/workspace/地理2/台湾采访册.txt
文件类型:UTF-8 Unicode text, with very long lines
总行数:2831行
文件大小:272,295 bytes

Step 2: 读取参考格式

读取了三份参考文件:

Step 3: 多轮grep关键词搜索

第一轮:衣料织物类关键词

grep -n '衣|裳|袍|衫|裙|裤|袄|襦|褐|裘|葛|麻|丝|绢|帛|锦|绮|绫|罗|缎|绣|绡|纱|绸' 台湾采访册.txt
→ 命中56行

主要命中分析:

第二轮:冠帽鞋履类关键词

grep -n '冠|帽|帻|幞头|弁|冕|屐|屦|鞋|袜|履|靴' 台湾采访册.txt
→ 命中约30行

主要命中分析:

第三轮:配饰类关键词

grep -n '带|佩|簪|钗|环|钏|珥|缨|绦|绶|鱼袋' 台湾采访册.txt
→ 命中约20行

主要命中分析:

第四轮:服饰复合词

grep -n '衣服|衣冠|衣裳|冠带|服饰|章服|品色|服色|穿|戴' 台湾采访册.txt
→ 命中约20行

主要命中分析:

第五轮:颜色词+服饰语境

grep -n '紫|绯|红|绿|青|白|黑|黄|朱|皂|玄|碧|翠' 台湾采访册.txt | grep '衣|裳|袍|衫|裙|冠|帽|鞋|履|服|穿|戴|着'
→ 命中约15行

主要命中分析:

第六轮:专项补充搜索

grep -n '顶戴|花翎|蓝翎|军装|制服|小典|衣物|短褐|衣带|蓑|笠' 台湾采访册.txt
→ 命中约25行

主要命中分析:

Step 4: sed提取上下文

对以下关键行号使用 sed -n '起始行,结束行p' 提取完整上下文:

Step 5: 精简筛选

从grep命中的约140行中,剔除以下非服饰内容:


关键发现

  1. 本书服饰内容极为稀少——《台湾采访册》为政务采访录,非文学作品或风土志,服饰描写几乎没有独立段落
  2. 帽仔街、鞋街、针街是唯一直接反映服饰行业的记载,但仅为街名罗列
  3. 顶戴/花翎/蓝翎记录最为集中(约18处),是清代台湾军事冠服制度的直接证据
  4. 衣物作为战争物资的记载(2处),反映服饰在闽粤冲突中的经济价值
  5. "小典"(衣物典当)是独特的台湾地方经济现象,值得社会经济史关注
  6. **"私易服散去"**是本书唯一涉及服饰与身份关系的生动描写

保存文件

文件 路径 大小
知识库总结 地理2output/台湾采访册/台湾采访册_总结.md ~3.4KB
操作日志 地理2output/台湾采访册/台湾采访册_日志.md 本文件
原文提取 地理2output/台湾采访册/台湾采访册_原文提取.md ~8KB

备注