《酌中志》服饰内容提取操作日志
基本信息
- 源文件:
/home/z/my-project/upload/part4/酌中志.txt - 文件编码:UTF-8(含少量不可解码字节,已用
iconv -c清洗) - 文件总行数:485行
- 清洗后文件:
/tmp/zhuozhongzhi_clean.txt(485行)
操作步骤
步骤1:查看文件总行数
wc -l /home/z/my-project/upload/part4/酌中志.txt
# 结果:485行
步骤2:文件编码检测与清洗
file /home/z/my-project/upload/part4/酌中志.txt
# 结果:DOS executable (COM),编码异常
iconv -f utf-8 -t utf-8 -c 酌中志.txt > /tmp/zhuozhongzhi_clean.txt
# 清洗后485行,可正常读取
步骤3:搜索服饰关键词
使用rg(ripgrep)搜索以下关键词组:
第一轮:核心服饰词
衣、裳、冠、冕、袍、裘、带、佩、巾、帻、履、舄、笏、绶、幞头、裙、衫、袄、褐、绅、
绫、罗、锦、绣、帛、绢、绸、缎、丝、棉、葛、麻、毡、帽、靴、鞋、袜、褂、领、袖、
袂、裾、襟、衽、裤、襦、襕、霞帔、簪、钗、钏、环、珮、鱼袋、服色、朝服、公服、
常服、丧服、祭服、戎服、赐服、赐紫、赐绯、蟒衣、飞鱼、补服、乌纱、金带、玉带、革带
匹配结果:142行含服饰关键词
步骤4:定位核心章节
rg -n '卷十九|佩服' zhuozhongzhi_clean.txt
# 结果:卷十九内臣佩服纪略 起始行355
步骤5:提取卷十九全文
- 起始行:355(卷十九内臣佩服纪略)
- 结束行:400(卷二十饮食好尚纪略之前)
- 共约45行,为全书服饰核心专章
步骤6:搜索其他卷服饰相关内容
高优先级搜索:
贴里|曳.*散|直身|道袍|罩甲|抹布|铎针|披肩|牌穗|牙牌|
蟒衣|蟒贴|蟒补|蟒服|蟒纱|蟒纻|补子|朝服|戎服|赐服|
玉带|金带|革带|飞鱼|斗牛|麒麟|乌纱
匹配分布:
| 卷次 | 行号 | 内容摘要 |
|---|---|---|
| 卷三 | 68 | 大红纱做贴里禳祝 |
| 卷五 | 83 | 易青布袍屏簪珥、升监玉带 |
| 卷九 | 116 | 始升监玉带 |
| 卷十 | 132 | 逆贤服色僭制、束发冠、金线蟒龙、方补戎衣 |
| 卷十 | 167 | 绯袍玉带充满道路 |
| 卷十四 | 169 | 穿红圆领玉带、穿红蟒衣窄袖 |
| 卷十六 | 208 | 穿贴里先斗牛次升坐蟒、穿曳散执藤条 |
| 卷十六 | 233 | 尚衣监掌造冠冕袍服履舄靴袜 |
| 卷十六 | 233 | 巾帽局职掌平巾官帽、朝衣冠笏带鞋 |
| 卷十六 | 233 | 针工局职掌冬衣夏衣 |
| 卷十六 | 233 | 都知监青红执事衣服、鹦哥等补子 |
| 卷十六 | 255 | 内承运库掌金银纱罗纻丝玉带 |
| 卷二十 | 404-417 | 节令服饰:葫芦景补子、蟒衣、闹蛾、五毒艾虎补子、鹊桥补子、阳生补子等 |
步骤7:低频关键词搜索
冕|裘|绶|幞|褐|锦|帛|毡|褂|袂|裾|衽|襦|襕|钏|珮|丧服|祭服|赐紫|赐绯
额外发现:
- 行43:锦衣卫带俸都指挥使、夺衣巾为民
- 行55:革衣巾拟戍大同
- 行83:易青布袍屏簪珥
步骤8:提取全文并人工审读
- 全文485行逐段审读
- 重点标注卷十九(行355-399)全部内容
- 标注其他卷服饰散见段落
步骤9:分类整理
将服饰内容分为以下大类:
- 服制总论:制度性与等威节约
- 衣类:贴里、曳散、圆领、直身、道袍、氅衣、大褶、顺褶、衬褶袍、罩甲、二色衣
- 冠帽类:官帽、平巾、长者巾、忠靖冠、六合巾、九华巾、晋巾、圆帽、唐朝帽、烟墩帽、束发冠
- 带佩类:带制升迁、牙牌、乌木牌、牌穗、抹布、铎针、枝个、桃杖、笏
- 鞋袜类:靴、青布鞋袜、油靴、棕靸
- 配件类:披肩、暖耳、围脖、雨衣雨帽、扁辫、撒扇
- 品级体系:从内使到太监的服制升迁路径
- 节令服饰:卷二十所载各节令换穿服饰
- 僭越服饰:逆贤擅政后的各种违规改制
步骤10:对抗式学术审查
- 核对关键词覆盖率:已覆盖任务要求的所有关键词
- 识别作者偏见:刘若愚对魏忠贤的批判可能影响服饰描述客观性
- 识别孤证:部分俗称(爪拉、刚叉帽)仅此一见
- 识别蚀字:原文■〈衤曳〉■〈衤散〉等需校勘
- 交叉验证建议:需与《明史·舆服志》《明会典》互证
产出文件清单
| 文件名 | 说明 | 大小 |
|---|---|---|
| 酌中志_总结.md | 服饰结构化综述 | ~18KB |
| 酌中志_日志.md | 完整操作记录(本文件) | ~6KB |
| 酌中志_原文提取.md | 带行号原始片段 | ~18KB |
技术备注
- 源文件存在UTF-8编码问题(含不可解码字节0xe9),需iconv清洗后方可正常处理
- 部分生僻字用■〈〉格式标注(如■〈衤曳〉■〈衤散〉),系原文录入时保留的异体字标注
- 卷十九为全书服饰专章,信息密度极高,其他卷仅有零散提及
- ripgrep搜索中文大字符集关键词时性能较差,需分批搜索
操作完成时间:2026年3月5日