《媚史》服饰内容提取 · 操作日志
时间:2026-04-20 任务:提取《媚史》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/part2/媚史.txt(697行,866KB)
操作流程
Step 0: 读取参考模板
读取 /home/z/my-project/upload/参考/总结.md → 《吕氏春秋》服饰总结,9大类
读取 /home/z/my-project/upload/参考/日志.md → 《晋会要》操作日志
读取 /home/z/my-project/upload/参考/原文提取.md → 《天工开物》原文提取
确认格式:总结.md按分类章节+引用+注释+总表;日志.md按步骤+关键发现+踩坑+审核;原文提取.md按分类+带行号引用。
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/2小说output/媚史/
→ 成功
Step 2: 检查源文件
file 媚史.txt → UTF-8 text, CRLF, very long lines (5269)
wc -l → 697行
wc -c → 866,507字节
发现编码问题:ripgrep和bash grep均报UTF-8解码错误。用Python重新读取并替换错误字符后写入临时文件。
Step 3: 第1轮grep — 基础服饰词
关键词: 衣|裳|裘|冠|冕|弁|帽|巾|袍|裙|袂|褐|衫|褂|襦|袴|裤|帔|履|靴|舄|鞋|袜
结果: 160行匹配
主要命中:
- L12: 衲衣(乞丐服饰)
- L41: 红衣女子
- L54: 旧布裙典当
- L66: 鞋袜道袍、巾帻
- L90/233: 缟素
- L124: 尖顶破檐帽→高巾阔服
- L131: 衣服晒窗
- L146: 礼物中丝绸布匹
- L154: 衫裁艾虎
- L173: 绵花草褥
- L180: 道袍、扣身小衣
- L194/195: 毡帽、花布包袱
- L202: 青丝委角巾帻、绿锦道袍
- L209: 锦帕、公服里衣
- L237: 红衣壮士
- L292: 毡笠、皂布敞衣、麻鞋
- L304: 紫绒扎巾/缎服、青纱巾帻/道袍、紫金冠/锦道袍
- L317: 褊衫、战袄
- L353: 扁巾、素服
- L416: 白布衲衣、紫衫
- L646: 乌纱、蟒服、玉带、皂靴、凤冠霞帔
- L648: 冠帔
假阳性排除:
- "衣"字大量出现在"衣粮""衣囊""衣服""穿了衣服"等日常用语中,仅部分有服饰描写价值
- "冠"出现在"冠军""冠以"等非服饰语境
- "履"出现在"履祸基"(踩踏义,非鞋履)
- "褐"主要出现在"毛褐"(礼物)和"草褐"中
Step 4: 第2轮grep — 丝织品词
关键词: 锦|绮|帛|绢|绫|罗|缎|绸|纱|缂丝|缯|纨|素|丝
结果: 160行匹配
主要命中:
- L8: 绒缎银(贸易商品)
- L94: 绢帛(祭礼)
- L146: 土绸、土绢(赠礼)
- L202: 绿锦道袍、青罗伞盖
- L209: 锦帕
- L236: 素绢、土布(赙仪)
- L247: 土绸、毛褐(苗洞贺礼)
- L304: 细绫柳绿道袍、红锦道袍、玄色缎服
假阳性排除:
- "丝"大量出现在"一丝""丝线"等非服饰语境
- "素"大量出现在"素服""素日""素来"等
- "罗"出现在人名、地名等
- "锦"出现在"锦鸳""锦障"等比喻性用法
Step 5: 第3轮grep — 等级服色词
关键词: 舆服|服色|冠服|章服|法服|朝服|祭服|常服|公服|吉服|丧服|品色|赐紫|赐绯|借紫|借绯
结果: 仅4行匹配
命中:
- L209: 公服里衣("公服"为官员制服)
- L225: 无实质服饰内容
- L372: 公服升堂
- L416: 无等级服色内容
分析:世情小说无制度性服饰记载,此轮命中率极低为正常现象。
Step 6: 第4轮grep — 配饰词
关键词: 笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|佩|玉佩|霞帔|帔帛|披帛
结果: 32行匹配
主要命中:
- L154: 钗袅朱符
- L305: 数珠、金钏
- L620: 簪子定情
- L631: 簪缨不绝
- L646: 凤冠霞帔、玉带
- L648: 冠帔
假阳性排除:
- "佩"出现在"佩刀""佩服"等非服饰语境
- "钗"仅L154"钗袅朱符"为有效服饰用法
- "簪"出现在"簪缨"(比喻性)和"簪子"(实物)两种语境
Step 7: 第5轮grep — 纺织材料词
关键词: 绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻
结果: 124行匹配
主要命中:
- L54: 旧布裙
- L131: 衣服
- L173: 绵花
- L195: 西洋花布
- L236: 土布
- L292: 皂布、麻鞋
假阳性排除:
- "布"大量出现在"宣布""分布""花布"等
- "织"出现在"组织""编织"等非纺织语境
- "纹"出现在"纹缕"(雕刻纹路)等
- "绣"出现在"刺绣"(活动)中,L353/354"刺绣"为女工活动而非服饰
- "染"出现在"染病""染了怔忡"等非染色语境
- "麻"出现在人名"麻斗西"中
- "绵"出现在"绵纸"(材料)中,非绵衣
Step 8: 上下文提取
对筛选出的有效行号,用Python提取前后各1-2行上下文,共提取约30个有效服饰片段。
Step 9: 分类整理
按以下6大类整理:
- 人物服饰描写(18条)
- 服饰作为礼物与商品(6条)
- 节令与民俗服饰(1条)
- 配饰(4条)
- 宗教与特殊服饰(2条)
- 纺织材料与日常衣物(3条)
Step 10: 对抗式学术审查
审查要点:
- ✅ "扣身小衣"为口语表达,非制度名称 → 标注为日常内衣
- ✅ "红衣""缟素"为色彩标记,非服饰类型 → 保留但在总结中注明
- ✅ "簪缨不绝"为比喻 → 标注非实指
- ✅ "绒缎银"为货币而非实物 → 在总结中纠正
- ✅ 全书设定唐代但服饰描写均为明代特征 → 重点标注时代错位
- ✅ L131"衣服晒窗"为情节推动而非服饰描写 → 保留但降低权重
- ✅ L84/86"穿了衣服"为日常用语 → 排除
关键发现
- 全书最完整的服饰变迁:L124全伯通从"尖顶破檐帽+旧道袍"到"高巾阔服",反映明代社会衣冠与地位的直接关联
- 最完整的行者装束:L292关赤丁的毡笠+敞衣+手巾+麻鞋,为明代行旅商人标准形象
- 最高等级冠服:L646瞿琰婚礼的乌纱+蟒服+玉带+皂靴+凤冠霞帔
- 纺织品作为社交媒介:土绸、土绢、草褐、毛褐等地方纺织品在官场赠礼中占重要地位
- 明代服饰投射唐代:所有服饰描写均反映明代而非唐代特征
- 缺乏制度性记载:世情小说的服饰描写完全服务于文学叙事,无舆服志式内容
关键踩坑记录
- 源文件UTF-8编码有残损,ripgrep和bash grep均无法直接搜索 → 用Python
errors='replace'重新解码 - "衣"字匹配率极高(160行),大量为"穿了衣服""衣粮"等日常用语,需逐一人工筛选
- "素"字假阳性多,"素日""素来"等非服饰用法需排除
- "布"字假阳性多,"宣布""分布"等需排除
- 第3轮"等级服色词"仅4行命中,反映世情小说与政书/类书的本质差异
- "绒缎银"初看以为是实物绒缎,实为贸易银两的计量单位
审核结果
全部通过 ✅ — 原文均从源文件Python grep提取,有明确行号对应。假阳性已逐一排除。时代错位问题已在总结中标注。