《陈检讨四六》服饰内容提取 · 日志
任务ID: batch17-2 时间:2026-04-23 操作:提取《陈检讨四六》全部服饰相关内容,整理分类总结
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/陈检讨四六
wc -l 陈检讨四六.txt → 546行
wc -c 陈检讨四六.txt → 802,083字节
file 陈检讨四六.txt → UTF-8, very long lines (3890), CRLF
Step 2: 读取参考文件
参考/总结.md → 《吕氏春秋》格式:分类总结+表格+核心思想
参考/日志.md → 《晋会要》格式:步骤+发现+踩坑+审核
参考/原文提取.md → 《天工开物》格式:分类+原文引用+注释
Step 3: 关键词搜索(多轮grep)
第一轮:复合关键词搜索
衣裳: 4 | 衣冠: 18 | 朝服: 2 | 祭服: 2 | 常服: 1 | 戎服: 2
赐服: 1 | 斗牛: 1 | 革带: 1 | 金带: 1 | 翟衣: 1 | 舆服: 3
第二轮:单字/词频统计
锦: 130 | 绮: 119 | 罗: 125 | 翠: 80 | 丝: 80 | 钗: 42
玉: 487 | 珠: 187 | 紫: 190 | 素: 208 | 金: 550 | 银: 141
袍: 31 | 裙: 31 | 绶: 36 | 裘: 27 | 衮: 18 | 衫: 18
第三轮:精确服饰词搜索
- 使用Python正则匹配高置信度服饰词汇
- 去除纯文学修饰(如"金科""银汉""珠斗"等非服饰用法)
- 结果:112个唯一行含服饰内容
Step 4: 上下文提取与噪音过滤
噪音类型及处理:
- 颜色词非服饰用法:如"紫微""黄道""青琐""白凤"——保留"青琐"(宫门装饰)等少数与服饰制度相关者
- 金属词非服饰用法:如"金科""银雁""玉衡"——仅保留"银黄""玉镂金带枕"等确与服饰相关者
- 锦/绮/罗等织物词:大量用于文学比喻("锦步障""绮纨之岁"等),逐条判断是否为实际服饰
- 衣冠复合词:多为"衣冠族/阀/第"(门阀之意),非直接服饰描述,但反映服饰与社会等级关系
Step 5: 分类整理
按10大类整理:
- 官服冠冕制度(貂蝉、簪笔、簪组、簪缨、侧帽等)
- 衣袍服色(罽袍、绮纨、布衣、短褐、释褐、蓝袍、赭衣等)
- 裘皮服饰(狐腋成裘、貂裘换酒、牛衣)
- 绶带印绶(银黄、紫艾绶、红绶、印绶)
- 裙钗佩饰(翟衣、翠翘、罗袜、玳瑁簪、佩环等)
- 履袜(丝履、罗袜、纳履踵决)
- 笏(床头之笏、执象笏)
- 纺织染织(织锦回文、织缣织素、缫丝、染帛、步障)
- 服色礼制(山龙华虫、白衣冠、委裘、赐服、施衿结帨等)
- 舆服杂录
Step 6: 保存三份文件
- 总结.md(2,542字)
- 原文提取.md(5,867字)
- 日志.md(本文件)
关键发现
- 骈文服饰以典故为主:《陈检讨四六》为清初骈文,服饰内容90%以上为征引前代典故,非直接记述当世服制
- 衣冠族阀概念突出:"衣冠"一词出现18次,绝大多数指"衣冠世族/门阀",反映六朝至清初的士族身份意识
- 貂蝉冠制记载详细:注释引《汉官仪》详述侍中冠制——武弁大冠加金珰附蝉、插貂尾
- 银黄=高官标志:怀银黄垂三组,为银印青绶+金印紫绶之合称
- 苏蕙织锦回文最详:注文引《臧荣绪晋书》完整记载璇玑图故事
- 侧帽风流典故:独孤信微侧帽驰马入城,人咸慕之——为冠帽风尚之佳话
- 革带移孔典故:沈约病瘦革带移孔,反映腰带与身体关系之文学表达
- 绛纱帐授业:韦逞母宋氏隔绛纱帐授徒,为女性教育制度之服饰侧面
- 赐服vs命服:引晋书注"三公八命……后有赐服非命服也",区分制度性赐服与特赐
- 释褐仪式:宋朝会要载兴国二年始赐吕蒙正等释褐,后遂为例
关键踩坑记录
- 极长行问题:文件546行但每行极长(最长3890字符),rg/grep处理时超时,改用Python逐行处理
- 编码问题:Bash直接rg报UTF-8解码错误,改用Python open(encoding='utf-8')成功
- 噪音极高:金/银/玉/珠/紫/素等字出现数百次,绝大多数为文学比喻而非服饰;需逐条判断
- 衣冠歧义:"衣冠"18次中,仅"白衣冠以送之""正衣冠而井水横流"为直接服饰行为,其余多为"衣冠族/阀/世族"之门阀含义
- 注释即出处:程师恭注文中包含大量原始出处(汉官仪、后汉书、晋书等),需区分正文与注文
审核结果
全部通过 ✅ — 原文均从《陈检讨四六》TXT中grep/Python提取,有明确行号与上下文对应,注文出处清晰可查。