《陶庐杂录》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 陶庐杂录 |
| 作者 | 清·法式善 |
| 文件路径 | /home/z/my-project/upload/part4/陶庐杂录.txt |
| 文件编码 | UTF-8(部分字节损坏,已用errors='replace'处理) |
| 总行数 | 771行 |
| 文件特点 | 笔记体,内容庞杂,服饰信息散见各卷 |
提取流程
第一步:文件检查
wc -l确认771行file命令确认UTF-8编码,但存在超长行(最长3691字符)- 发现文件末尾存在编码损坏字节,使用Python
decode('utf-8', errors='replace')生成清理版
第二步:关键词搜索
搜索服饰关键词共计70余个,分为以下类别:
| 类别 | 关键词 |
|---|---|
| 服装类 | 衣、袍、裘、衫、袄、裙、褐、褂、襦、襕、裤 |
| 冠帽类 | 冠、冕、帽、巾、帻、幞头、乌纱 |
| 配饰类 | 带、佩、笏、绶、簪、钗、钏、珮、鱼袋 |
| 鞋履类 | 履、舄、靴、鞋、袜 |
| 织物类 | 绫、罗、锦、帛、绢、绸、缎、丝、葛、麻、毡 |
| 服制类 | 朝服、公服、常服、丧服、祭服、戎服、赐服、补服、服色、服制 |
| 特殊服饰 | 蟒衣、飞鱼、赐紫、赐绯、霞帔、金带、玉带、革带 |
第三步:搜索结果统计
| 搜索轮次 | 命中行数 | 说明 |
|---|---|---|
| 首轮广搜 | 69行 | 包含大量非服饰用法的"衣""冠""带"等 |
| 二轮精筛 | 23条 | 剔除纯比喻/泛称后,真正涉及服饰的条目 |
| 三轮补充 | +4条 | 补充"弋绨""皂细袍""缣布""比邱冠"等特殊词 |
第四步:筛选标准
纳入标准:
- 直接描述服饰形制、材质、穿着方式
- 涉及服饰制度(舆服志、礼制)
- 服饰相关的经济、政治、社会论述
- 诗文中的具体服饰意象(非纯比喻)
排除标准:
- 纯比喻用法:"衣钵"(喻传承)、"裘马"(喻富贵)→ 但保留并标注为比喻义
- 泛称词组:"衣食不足""食租衣税"→ 保留但标注为间接参考
- 非服饰专义:"冠以序文"(冠=居前)、"履亩均丈"(履=践行)→ 排除
- 书名/人名中的字:"青衣"(方外青衣卷)、"缙绅"(官绅)→ 部分保留并标注
第五步:对抗式学术审查
审查问题1:误收风险
| 条目 | 风险点 | 处理 |
|---|---|---|
| "西涯衣钵委而去" | "衣钵"为佛教传承比喻,非实指服饰 | 保留,标注"比喻义" |
| "裘马之气,一洗而空" | "裘马"喻富贵气焰 | 保留,标注"比喻义" |
| "冠以序文" | 冠=居首,非冠帽 | 排除 |
| "履亩均丈" | 履=践行,非鞋履 | 排除 |
| "缙绅""搢绅" | 绅=官宦代称 | 保留,标注"身份代称" |
审查问题2:漏收风险
- 已补充搜索"弋绨""皂细袍""皮履""华衮""布被""韦带""缣布""比邱冠"等复合词
- 已检查"绣衣使者"(L535),确认为汉代制度性服饰标识
- 已检查"绫印钞制"(L165),确认为织物用于货币的特殊用途
审查问题3:编码损坏影响
- L51原文"纨□之子"应为"纨绔之子"(纨绔=细绢裤,代指富贵子弟)
- L591原文"敝□"应为"敝緼"(破旧棉衣)
- L51原文"袜首弓□"中"□"可能为"服"字
- 以上损坏已在原文提取中标注说明
第六步:分类方案
最终将23条服饰内容归为6大类:
- 帝王后妃画像与服饰图像(2条)
- 明代武职服饰与仪卫(4条)
- 礼仪服饰制度与经籍考证(3条)
- 帝王服饰与节俭政治(3条)
- 服饰经济与社会风俗(5条)
- 诗文中的服饰意象(6条)
输出文件
| 文件名 | 内容 | 大小限制 |
|---|---|---|
| 陶庐杂录_总结.md | 服饰内容分类总结与学术评估 | ≤20KB |
| 陶庐杂录_日志.md | 本文件,提取流程与审查记录 | ≤20KB |
| 陶庐杂录_原文提取.md | 服饰相关原文摘录 | ≤20KB |