研究总结 日志 原文

《媚史》服饰内容提取 · 操作日志

时间:2026-04-20 任务:提取《媚史》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/part2/媚史.txt(697行,866KB)


操作流程

Step 0: 读取参考模板

读取 /home/z/my-project/upload/参考/总结.md → 《吕氏春秋》服饰总结,9大类
读取 /home/z/my-project/upload/参考/日志.md → 《晋会要》操作日志
读取 /home/z/my-project/upload/参考/原文提取.md → 《天工开物》原文提取

确认格式:总结.md按分类章节+引用+注释+总表;日志.md按步骤+关键发现+踩坑+审核;原文提取.md按分类+带行号引用。

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/2小说output/媚史/
→ 成功

Step 2: 检查源文件

file 媚史.txt → UTF-8 text, CRLF, very long lines (5269)
wc -l → 697行
wc -c → 866,507字节

发现编码问题:ripgrep和bash grep均报UTF-8解码错误。用Python重新读取并替换错误字符后写入临时文件。

Step 3: 第1轮grep — 基础服饰词

关键词: 衣|裳|裘|冠|冕|弁|帽|巾|袍|裙|袂|褐|衫|褂|襦|袴|裤|帔|履|靴|舄|鞋|袜
结果: 160行匹配

主要命中:

假阳性排除:

Step 4: 第2轮grep — 丝织品词

关键词: 锦|绮|帛|绢|绫|罗|缎|绸|纱|缂丝|缯|纨|素|丝
结果: 160行匹配

主要命中:

假阳性排除:

Step 5: 第3轮grep — 等级服色词

关键词: 舆服|服色|冠服|章服|法服|朝服|祭服|常服|公服|吉服|丧服|品色|赐紫|赐绯|借紫|借绯
结果: 仅4行匹配

命中:

分析:世情小说无制度性服饰记载,此轮命中率极低为正常现象。

Step 6: 第4轮grep — 配饰词

关键词: 笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|佩|玉佩|霞帔|帔帛|披帛
结果: 32行匹配

主要命中:

假阳性排除:

Step 7: 第5轮grep — 纺织材料词

关键词: 绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻
结果: 124行匹配

主要命中:

假阳性排除:

Step 8: 上下文提取

对筛选出的有效行号,用Python提取前后各1-2行上下文,共提取约30个有效服饰片段。

Step 9: 分类整理

按以下6大类整理:

  1. 人物服饰描写(18条)
  2. 服饰作为礼物与商品(6条)
  3. 节令与民俗服饰(1条)
  4. 配饰(4条)
  5. 宗教与特殊服饰(2条)
  6. 纺织材料与日常衣物(3条)

Step 10: 对抗式学术审查

审查要点:

  1. ✅ "扣身小衣"为口语表达,非制度名称 → 标注为日常内衣
  2. ✅ "红衣""缟素"为色彩标记,非服饰类型 → 保留但在总结中注明
  3. ✅ "簪缨不绝"为比喻 → 标注非实指
  4. ✅ "绒缎银"为货币而非实物 → 在总结中纠正
  5. ✅ 全书设定唐代但服饰描写均为明代特征 → 重点标注时代错位
  6. ✅ L131"衣服晒窗"为情节推动而非服饰描写 → 保留但降低权重
  7. ✅ L84/86"穿了衣服"为日常用语 → 排除

关键发现

  1. 全书最完整的服饰变迁:L124全伯通从"尖顶破檐帽+旧道袍"到"高巾阔服",反映明代社会衣冠与地位的直接关联
  2. 最完整的行者装束:L292关赤丁的毡笠+敞衣+手巾+麻鞋,为明代行旅商人标准形象
  3. 最高等级冠服:L646瞿琰婚礼的乌纱+蟒服+玉带+皂靴+凤冠霞帔
  4. 纺织品作为社交媒介:土绸、土绢、草褐、毛褐等地方纺织品在官场赠礼中占重要地位
  5. 明代服饰投射唐代:所有服饰描写均反映明代而非唐代特征
  6. 缺乏制度性记载:世情小说的服饰描写完全服务于文学叙事,无舆服志式内容

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从源文件Python grep提取,有明确行号对应。假阳性已逐一排除。时代错位问题已在总结中标注。