研究总结 日志 原文

《江淮异人录》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《江淮异人录》全部服饰相关内容,整理分类总结 输入文件:/home/z/my-project/upload/part3/江淮异人录.txt 输出目录:/home/z/my-project/upload/3笔记output/江淮异人录/


Step 0: 文件基本信息

wc -l /home/z/my-project/upload/part3/江淮异人录.txt
# 结果:142行

stat --format="%s bytes" /home/z/my-project/upload/part3/江淮异人录.txt
# 结果:53819 bytes

文件规模较小(<500KB),但按规则仍不整本加载,使用grep定位+Read工具分段读取。


Step 1: 读取词库

读取 /home/z/my-project/skills/rysxguji/references/fushi-keywords.md,获取:


Step 2: 第1轮grep——核心服饰词

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|钗|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' 江淮异人录.txt

命中行数:25行(含重复版本)

关键命中


Step 3: 第2轮grep——制度动作词

rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 江淮异人录.txt

命中行数:0行

本书为志怪笔记,无制度性内容,故制度动作词无命中,符合预期。


Step 4: 第3轮grep——组合扩展词

rg -n '品色|三品已上服紫|五品已上服绯|赐鱼袋|佩鱼|蟒衣|飞鱼服|蚕|桑|茧|缫|织|纺|缂丝|折帛|和买|市舶|绢价|匹帛|乌纱|软脚|硬脚|展角' 江淮异人录.txt

命中行数:0行

无品色制度、赐服体系、蚕桑纺织等组合词命中。


Step 5: 排除规则审查

逐条对照排除规则表审查全部命中:

关键词 位置 原文 判断 处理
行50/121 "抚州麻姑山" 地名,非服饰 ✅排除
行65/105 "忽若裂帛声" 比喻义,形容声音 ✅排除
锦绣 行44 "浪叠朝霞锦绣翻" 诗句比喻,但仍含丝织品意象 ✅保留
金帛 行41/97 "尽取金帛与之" 丝帛作为财物形态 ✅保留
布衣 行44 "日与布衣饮酒" 代指平民,按规则保留 ✅保留
衣箱 行68/125 "衣箱,常自启闭" 盛衣之箱,含服饰信息 ✅保留
衣单 行80/119 "见其衣单" 衣=服装,单=单薄 ✅保留
青衣 行133 "指一青衣" 仆役服色 ✅保留
持简 行65/105 "见上多持简" 简=手板,朝仪佩饰 ✅保留

排除2项:麻姑山(地名)、裂帛声(比喻) 保留20项:通过审查


Step 6: sed上下文提取

由于全书仅142行,且每条故事基本在一行内完整(笔记体),Read工具已读取全文上下文。无需额外sed提取。


Step 7: 分类整理

将20条有效命中按7类整理:

  1. 道士/异人法服(6条):碧霞帔、冠褐蹑履/屐、道服、巾+方巾、短布衣+乌缯巾、青萝冠+碧绿衣
  2. 鬼魅幻化服饰(4条):珠衣、绿衣、腰带、不受衲衣
  3. 日常服色(6条):绯衣、衣服鲜楚、换新衣、青衣、卖鞋、布衣
  4. 丝织品(5条):细绢、夹缣、金帛、锦绣、乌缯
  5. 穿着行为(3条):易服、解衣而坐、持衣
  6. 丧葬服饰(1条):换衣坐化
  7. 佩饰(1条):持简

Step 8: 对抗式审查

8.1 漏检检查

8.2 误收检查

8.3 版本差异


Step 9: 生成3个MD文件

文件 内容 大小
江淮异人录_总结.md 结构化分类总结+关键发现+版本差异 ~8KB
江淮异人录_日志.md 本文件,操作日志 ~6KB
江淮异人录_原文提取.md 20条原文摘录+注释 ~10KB

操作流程轨迹

读取文件信息✅(142行/53KB) → 读取词库✅ → 第1轮grep✅(25行命中)
→ 第2轮grep✅(0行命中) → 第3轮grep✅(0行命中)
→ 排除审查✅(排除2项:麻姑山/裂帛声) → 对抗式审查✅
→ 分类整理✅(7类20条) → 生成3个MD✅ → 保存到输出目录✅

关键发现

审核结果