研究总结 日志 原文

《岭海舆图》服饰内容提取 — 操作日志

操作时间:2026-05-03 操作者:AI Subagent


操作流程

Step 1: 读取技能文件

read ~/.openclaw/skills/rysxguji/SKILL.md
→ 获取"扩展能力:本地TXT服饰逐本整理"章节操作规范

Step 2: 读取参考模板

read /root/.openclaw/workspace/参考/总结.md → 《吕氏春秋》服饰综述模板
read /root/.openclaw/workspace/参考/日志.md → 《警世通言》操作日志模板
read /root/.openclaw/workspace/参考/原文提取.md → 《天工开物》原文提取模板

Step 3: 确认输入文件

wc -l /root/.openclaw/workspace/地理2/岭海舆图.txt
→ 499行,约5万字

Step 4: 文件名编码问题处理

直接 grep 岭海舆图.txt 报错"No such file or directory"
→ 原因:shell locale 无法匹配 UTF-8 文件名
→ 解决:cp 岭海舆图.txt /tmp/lh.txt,后续操作基于 /tmp/lh.txt

Step 5: 多轮关键词 grep 搜索

第1轮:基础服饰关键词

grep -n '衣' /tmp/lh.txt → 3行命中(行222、396、488-489)

第2轮:扩展服饰+军事装备关键词

grep -n '裳\|袍\|衫\|裙\|冠\|帽\|靴\|鞋\|袜\|带\|佩\|锦\|绣\|绫\|罗\|绢\|丝\|绸\|缎\|裘\|褐\|布\|麻\|葛\|服\|织\|染\|蚕\|茧\|纱\|甲\|盔\|铠\|胄\|冕\|弁\|簪\|缨\|绅\|绒\|毡' /tmp/lh.txt

命中行分布:

第3轮:精确提取服饰描写

grep -n '衣冠\|布衣\|盔\|甲\|带\|丝\|布\|麻\|纱\|絣\|綿\|被\|缦\|绒\|织\|染\|蚕\|茧\|缎\|绸\|绢\|罗\|锦\|绣' /tmp/lh.txt

→ 补充确认行89、136、192、195、256、297、330、371、433等税收行中的黄麻、丝记载

Step 6: sed 提取上下文

对核心命中行(96-97、222、396、488-497)使用 read 工具提取完整上下文段落。

Step 7: 冗余噪音过滤

过滤规则:

保留项:

Step 8: 对抗式学术审查

检查1:原文存在性验证

行96 "六瓣明衬盔各二十顶齐腰甲二十付" → ✅ grep命中
行222 "衣冠文物" → ✅ grep命中
行396 "布衣有疏" → ✅ grep命中
行489 "畨纱红印花布油红绵布" → ✅ grep命中

检查2:结论支撑性

检查3:排除误判

审查结论:全部通过 ✅

Step 9: 产出三份MD


关键发现

  1. 本书为舆地图志而非服饰专著,服饰内容属于地理行政文献中的附带记载
  2. 军器配置是最集中的"服饰"内容(行96-97),反映明代卫所装备制度
  3. 南夷朝贡织物品名最丰富(行488-497),涉及印度洋-东南亚-中国三大纺织体系
  4. 无品色制度、无冕服制度、无日常服饰描写,与典型的舆服志类文献截然不同
  5. "衣冠文物"为文化象征用语,非服饰实物描述
  6. 全书服饰相关内容约500字,占全书比例不足1%

保存文件

文件 路径 大小
服饰综述 地理2output/岭海舆图/岭海舆图_总结.md ~2KB
操作日志 地理2output/岭海舆图/岭海舆图_日志.md 本文件
原文提取 地理2output/岭海舆图/岭海舆图_原文提取.md ~3KB

备注