研究总结 日志 原文

《湘烟小录》服饰内容提取 — 操作日志

日期:2026-04-19 任务:提取《湘烟小录》全部服饰相关内容 输入文件:/home/z/my-project/upload/part3/湘烟小录.txt 文件规模:746行 / 93KB


Step 1: 文件基本信息

wc -l 湘烟小录.txt  # 746行
ls -lh 湘烟小录.txt  # 93KB

Step 2: 读取词库

词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md 已完整读取。


Step 3: 第1轮grep — 核心服饰词

rg -n '衣|裳|冠|……' 湘烟小录.txt | wc -l
# 结果:132行命中

Step 4: 第2轮grep — 制度动作词

rg -n '赐服|赐紫|赐绯|……' 湘烟小录.txt | wc -l
# 结果:2行命中

Step 5: 第3轮grep — 组合扩展词

rg -n '簪|钗|钏|花钿|步摇|霞帔|退红衫子|殓衣|寒衣|制衣|纨绮|罗帱|凤舄|钿蝉|珠襦|罗襟|绣袜|铅华|荆布' 湘烟小录.txt | wc -l
# 结果:约45行命中

Step 6: 排除审查

关键词 误命类型 排除操作
人名、罗列 排除~5行,保留3行
锦绣比喻 排除~8行,保留2行
修辞 排除~6行,保留2行
翠竹等 排除~10行,保留3行
比喻 排除~8行,保留2行
赐服黄菊花(药) 排除1行

排除后有效命中:约45行(含14条高质量/中等质量服饰条目)


Step 7: 分类整理

将14条有效命中分为5类:

  1. 日常服饰行为(8条)
  2. 首饰与佩饰(9条)
  3. 衣裙名目(9条)
  4. 殓服与丧礼(4条)
  5. 出家意象(3条)

Step 8: 生成三份文件

文件 路径
总结 /home/z/my-project/upload/3笔记output/湘烟小录/湘烟小录_总结.md
日志 /home/z/my-project/upload/3笔记output/湘烟小录/湘烟小录_日志.md
原文 /home/z/my-project/upload/3笔记output/湘烟小录/湘烟小录_原文提取.md

操作流程轨迹

文件基本信息确认✅(746行/93KB)
→ 读取词库✅
→ 第1轮grep核心词132行命中
→ 第2轮grep制度词2行命中(均排除)
→ 第3轮grep组合扩展~45行命中
→ 排除审查(~87行排除,~45行有效)
→ 分类整理5类14条
→ 生成3份MD文件

统计摘要

指标 数值
文件总行数 746
第1轮原始命中行 132
第2轮原始命中行 2
第3轮扩展命中行 ~45
排除后有效行 ~45
高/中质量服饰条目 14
分类数 5