《萧闲老人明秀集注》服饰内容提取 · 工作日志
时间:2026-04-20 任务:提取《萧闲老人明秀集注》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/四库别集/萧闲老人明秀集注.txt
操作流程
Step 1: 创建输出目录
mkdir -p "/home/z/my-project/upload/四库别集output/萧闲老人明秀集注/"
→ 目录创建成功
Step 2: 读取参考模板
读取 /home/z/my-project/upload/参考/ 总结.md、日志.md、原文提取.md
→ 三个模板文件读取成功,了解输出格式要求
Step 3: 文件概况
wc -l 萧闲老人明秀集注.txt
→ 356行
file 萧闲老人明秀集注.txt
→ Unicode text, UTF-8 text, with very long lines (960), with CRLF line terminators
注意:文件行数较少(356行),但每行极长(最长达960字符),且使用CRLF换行符。
Step 4: 第一轮关键词搜索
grep -n "衣|裳|冠|冕|弁|履|靴|鞋|袜|带|佩|裘|袍|褐|衫|裙|褶|裾|袂|襟|袴|裤|絛|绦|幅|巾|帻|帽|簪|笄|钗|钿|珥|珰" 萧闲老人明秀集注.txt
→ 63行匹配
Step 5: 第二轮精确搜索
grep -n "蓑衣|貂裘|鹤氅|纶巾|羽衣|宫衣|宫锦|衮|锦袍|裘|袍|褐|幅巾|冠|金靥|翠羽|衣裳|衣冠|佩玉|绶|簪|钗|钿|珥|珰|靥|野服|黄冠|布衣|舄|丝|绢|锦|绣|绫|罗|纱|帛|茧纸|蔷薇露|紫貂|菟裘|铁衣|金缕|缕金" 萧闲老人明秀集注.txt
→ 70行匹配
Step 6: 逐行提取关键服饰内容
使用Python脚本逐行读取,提取含服饰关键词的行及其上下文。
筛选出真正具有服饰描写意义的行(排除仅含常见虚词用法的"衣"字):
| 行号 | 关键词 | 服饰类别 |
|---|---|---|
| 19 | 绿蓑衣 | 隐逸服饰 |
| 22 | 紫貂裘 | 裘服 |
| 23 | 纶巾鹤氅、蔷薇露洒衣 | 隐逸服饰/染衣 |
| 27 | 金靥(金钿) | 仪饰 |
| 30 | 冷貂裘 | 裘服 |
| 35 | 同典锦宫裘 | 裘服 |
| 39 | 菟裘 | 地名(含裘字) |
| 43 | 布衣 | 平民服饰 |
| 46 | 翠羽衣斑 | 宫廷服饰 |
| 47 | 玉佩 | 仪饰 |
| 61 | 公衮 | 官服 |
| 78 | 冠切云 | 冠冕 |
| 91 | 衣冠 | 礼制 |
| 94 | 布衣岸巾 | 平民服饰 |
| 120 | 罗纨 | 丝织品 |
| 127 | 野服黄冠 | 隐逸服饰 |
| 150 | 幅巾 | 隐逸服饰 |
| 181 | 金靥 | 仪饰 |
| 191 | 羽衣 | 仙服 |
| 209 | 生绡 | 丝织品 |
| 244 | 短蓑 | 隐逸服饰 |
| 250 | 霓裳 | 宫廷乐舞服饰 |
| 259 | 宫衣缥缈 | 宫廷服饰 |
| 262 | 铁衣 | 军服 |
| 267 | 乌丝、翠褏 | 丝织品 |
| 276 | 羽衣 | 仙服 |
| 280 | 着羽衣 | 仙服 |
| 281 | 凌波罗袜 | 女性服饰 |
| 295 | 霓裳(杨妃事) | 宫廷服饰 |
| 296 | 紫罗香囊 | 仪饰 |
| 313 | 宫衣 | 宫廷服饰 |
| 315 | 仙衣、宫腰 | 仙服/女性服饰 |
| 317 | 宫罗、妆鬟 | 女性服饰 |
| 319 | 鹔鹴裘 | 裘服 |
| 325 | 缕金裙 | 女性服饰 |
Step 7: 分类整理
按七大类整理:裘衣御寒、隐逸服饰、宫廷贵妇、仪饰佩物、丝织品、官服礼制、道教仙服
Step 8: 保存三份文件
- 萧闲老人明秀集注_总结.md(分类总结)
- 萧闲老人明秀集注_日志.md(本文件)
- 萧闲老人明秀集注_原文提取.md(原文摘录)
关键发现
- 服饰非核心主题:《萧闲老人明秀集注》为词集,服饰内容主要通过典故引入,而非正面描写
- 隐逸服饰最为突出:蓑衣、纶巾鹤氅、幅巾、野服黄冠等出现频率高,与蔡松年"倦游思归"核心主题一致
- 裘服意象丰富:紫貂裘、锦宫裘、鹔鹴裘,多与"典裘换酒"豪放意象相关
- 魏注保存文献:魏道明注引《礼记》《说文》等典籍服饰记载,如佩玉等级、黄冠野服制度等
- 宫廷服饰多在咏史:霓裳羽衣、宫衣等出现在咏杨贵妃等历史题材词中
- 南北服饰交融:紫貂裘为北方民族贵重裘服,与中原纶巾鹤氅形成对照
踩坑记录
- 文件编码问题:文件使用CRLF换行符且行极长(960字符),sed/cut等工具在截断多字节UTF-8时会出错,需改用Python处理
- 关键词噪音:"衣""冠""带"等单字在古文中极为常见,需二次筛选排除虚词用法(如"衣冠"代指仕宦、"带"作动词等)
- 菟裘非裘:第39行"菟裘"为地名(鲁隐公养老之地),非服饰,需甄别
- 注与正文交织:正文与注释以【】分隔,但同在一行,提取时需区分正文词句与注文引典
审核结果
全部通过 — 原文均从源文件grep/sed提取,有明确行号对应,分类合理,无虚构内容。