《梧岡集》服饰内容提取 · 日志
书名:梧岡集(明·唐文凤) 源文件:/home/z/my-project/upload/四库别集/梧冈集.txt 输出目录:/home/z/my-project/upload/四库别集output/梧岡集/ 处理时间:2026-03-05
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/梧岡集/
Step 2: 查看文件信息
wc -l /home/z/my-project/upload/四库别集/梧冈集.txt
→ 2161行
注意:文件名为"梧冈集.txt"(简体"冈"),非"梧岡集"。
Step 3: 五轮grep扫描
| 轮次 | 关键词类 | 命中行数 | 说明 |
|---|---|---|---|
| R1 | 衣裳袍裘袂襟袖裾袴襦褐衫褂袄 | ~60行 | "衣"最多,含大量"衣锦乡"地名 |
| R2 | 冕弁巾帽帻簪笄佩带绅绶笏芾 | ~55行 | "带"含大量动词/地理用法 |
| R3 | 锦绮帛绢绫罗缎绸纱缂缟纨绨绉 | ~40行 | "锦"含大量地名/比喻 |
| R4 | 丝麻葛苎布毡绵染绣黼黻衮 | ~35行 | "丝"含大量比喻,"葛"含人名地名 |
| R5 | 履舄靴鞋袜朝服祭服丧服礼服法服等 | ~15行 | 命中较少 |
五轮合计命中约90行(去重后约65独立行)。
Step 4: 关键行上下文提取
用 sed -n 'start,endp' 提取以下关键行段上下文(前2行后5行):
- L153-157(萝衣)
- L219-223(云衣云裳)
- L277-281(翠袖)
- L281-285(黄裳)
- L349-353(葛衣)
- L442-447(缟衣玄裳翠衿明珰)
- L496-501(锦袍绣鞍貂帽)
- L510-516(鞋山宫鞵凌波袜)
- L533-537(蓑衣箬笠)
- L566-570(衲衣)
- L631-635(缟衣缁尘)
- L653-659(绛裙羊裘)
- L686-692(陈桥兵变服饰群像)
- L893-897(典春衫)
- L949-953(短褐)
- L1017-1021(牛衣)
- L1121-1129(青衫貂裘)
- L1191-1197(元币改制品服)
- L1250-1255(獬豸冠)
- L1617-1626(彩衣曲)
- L1671-1675(珠襦)
- L1793-1797(衣冠俊伟)
- L1860-1866(武侯像纶巾氅衣)
- L1939-1945(衣冠北面殉节、赐帽履衣)
- L2000(遵礼服)
- L2081-2085(布帛)
Step 5: 非服饰用法过滤
排除以下伪服饰条目:
| 排除类型 | 例句 | 行号 |
|---|---|---|
| 地名 | 衣锦乡 | L67,69,81,94,99,794,800 |
| 地理比喻 | 睠兹衣带水 | L175 |
| 动词用法 | 带近郭、带雨收、带雨张帆 | L339,939,1055 |
| 地名 | 葛陂、锦津、锦里、锦水 | L193,271,77,81 |
| 人名 | 葛姥、葛洪 | L81,1919 |
| 成语 | 白衣苍狗 | L614 |
| 水草 | 荇带牵 | L151 |
| 河流比喻 | 练带 | L726 |
| 山喻 | 山冠以危楼 | L736 |
| 云喻 | 云覆帽、云补裳 | L959,529 |
| 代称 | 巾帼遗(女流辈) | L427 |
| 成语 | 箕裘业 | L1341 |
| 胸怀 | 襟怀壮 | L1320 |
| 代称 | 冠盖相望 | L715 |
| 音乐 | 丝竹留余响 | L100 |
| 农事 | 桑麻 | L630,1276,1465 |
| 地名 | 绵州、木绵庵 | L1055 |
| 转义 | 布衣(平民代称保留但标注) | L207 |
| 转义 | 儒冠(学者代称) | L816 |
| 修辞 | 锦绣/绮(喻花) | L1883 |
Step 6: 撰写三份MD文档
| 文件 | 大小 | 内容 |
|---|---|---|
| 梧岡集_原文提取.md | ~12KB | 8类45条服饰原文,含行号引用与关键词加粗 |
| 梧岡集_总结.md | ~8KB | 5大核心发现+文学功能分析+对抗式审查+学术评估 |
| 梧岡集_日志.md | ~5KB | 操作流程+过滤规则+验证结果 |
Step 7: 对抗式学术审查
- 过度解读风险:陈桥兵变图服饰为明人想象性还原,非宋初服制实录
- 遗漏风险:铁冠道人、圭组簮绂未展开
- 时代归属:文学典故不可等同于明代实际服饰
- 过滤验证:抽取10条核心引文与原文核对,均确认无误
统计摘要
- 处理行数:2161行
- 五轮grep命中:约90行(去重后约65独立行)
- 有效服饰条目:约45条
- 排除非服饰用法:约20处
- 核心发现:陈桥兵变服饰群像、元币改制品服、武侯像野服描写、渔隐服饰谱系、彩衣孝道主题
日志完。