研究总结 日志 原文

《湛园札记》服饰内容提取 — 操作日志

日期:2026-04-19 任务:提取《湛园札记》全部服饰相关内容 输入文件:/home/z/my-project/upload/part3/湛园札记.txt 文件规模:488行 / 129KB


Step 1: 文件基本信息

wc -l 湛园札记.txt  # 488行
ls -lh 湛园札记.txt  # 129KB

Step 2: 读取词库

词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md 已完整读取。


Step 3: 第1轮grep — 核心服饰词

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|……' 湛园札记.txt | wc -l
# 结果:88行命中

Step 4: 第2轮grep — 制度动作词

rg -n '赐服|赐紫|赐绯|……|僭|……|冠礼|笄礼|释服|加冠' 湛园札记.txt | wc -l
# 结果:4行命中

Step 5: 第3轮grep — 组合扩展词

rg -n '朝服|公服|冠服|衮冕|舆服|赐服|常服|祭服|法服|深衣|蟒衣|鱼袋|幞头|霞帔|裲裆|蔽膝|弁|胄|缨|花钿|蹀躞|缂丝|黼|黻|翟衣|袆衣|赐紫|赐绯|玉带|金带|犀带|鞓带|革带|赐衣|赐帛|束帛|锦衣|紫袍|绯袍|朝服|幅巾|野服|短褐|丧服|缞|墨缞|赗禭|襚|卤簿' 湛园札记.txt | wc -l
# 结果:约64行命中

Step 6: 排除审查

关键词 误命类型 排除操作
服从、服丧、服药 排除~10行,保留3行
冠军等 排除~3行,保留3行
地带、带领 排除~5行,保留1行
锦州 排除~2行,保留0行
政治僭越 排除2行,保留0行

排除后有效命中:约20行(含16条高质量/中等质量服饰条目)


Step 7: 分类整理

将16条有效命中分为4类:

  1. 礼制考证(5条)
  2. 冠服制度(5条)
  3. 历史服饰品评(3条)
  4. 制度词语考证(3条)

Step 8: 生成三份文件

文件 路径
总结 /home/z/my-project/upload/3笔记output/湛园札记/湛园札记_总结.md
日志 /home/z/my-project/upload/3笔记output/湛园札记/湛园札记_日志.md
原文 /home/z/my-project/upload/3笔记output/湛园札记/湛园札记_原文提取.md

操作流程轨迹

文件基本信息确认✅(488行/129KB)
→ 读取词库✅
→ 第1轮grep核心词88行命中
→ 第2轮grep制度词4行命中(2行保留)
→ 第3轮grep组合扩展~64行命中
→ 排除审查(~68行排除,~20行有效)
→ 分类整理4类16条
→ 生成3份MD文件

统计摘要

指标 数值
文件总行数 488
第1轮原始命中行 88
第2轮原始命中行 4
第3轮扩展命中行 ~64
排除后有效行 ~20
高/中质量服饰条目 16
分类数 4