研究总结 日志 原文

《萧闲老人明秀集注》服饰内容提取 · 工作日志

时间:2026-04-20 任务:提取《萧闲老人明秀集注》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/四库别集/萧闲老人明秀集注.txt


操作流程

Step 1: 创建输出目录

mkdir -p "/home/z/my-project/upload/四库别集output/萧闲老人明秀集注/"
→ 目录创建成功

Step 2: 读取参考模板

读取 /home/z/my-project/upload/参考/ 总结.md、日志.md、原文提取.md
→ 三个模板文件读取成功,了解输出格式要求

Step 3: 文件概况

wc -l 萧闲老人明秀集注.txt
→ 356行
file 萧闲老人明秀集注.txt
→ Unicode text, UTF-8 text, with very long lines (960), with CRLF line terminators

注意:文件行数较少(356行),但每行极长(最长达960字符),且使用CRLF换行符。

Step 4: 第一轮关键词搜索

grep -n "衣|裳|冠|冕|弁|履|靴|鞋|袜|带|佩|裘|袍|褐|衫|裙|褶|裾|袂|襟|袴|裤|絛|绦|幅|巾|帻|帽|簪|笄|钗|钿|珥|珰" 萧闲老人明秀集注.txt
→ 63行匹配

Step 5: 第二轮精确搜索

grep -n "蓑衣|貂裘|鹤氅|纶巾|羽衣|宫衣|宫锦|衮|锦袍|裘|袍|褐|幅巾|冠|金靥|翠羽|衣裳|衣冠|佩玉|绶|簪|钗|钿|珥|珰|靥|野服|黄冠|布衣|舄|丝|绢|锦|绣|绫|罗|纱|帛|茧纸|蔷薇露|紫貂|菟裘|铁衣|金缕|缕金" 萧闲老人明秀集注.txt
→ 70行匹配

Step 6: 逐行提取关键服饰内容

使用Python脚本逐行读取,提取含服饰关键词的行及其上下文。

筛选出真正具有服饰描写意义的行(排除仅含常见虚词用法的"衣"字):

行号 关键词 服饰类别
19 绿蓑衣 隐逸服饰
22 紫貂裘 裘服
23 纶巾鹤氅、蔷薇露洒衣 隐逸服饰/染衣
27 金靥(金钿) 仪饰
30 冷貂裘 裘服
35 同典锦宫裘 裘服
39 菟裘 地名(含裘字)
43 布衣 平民服饰
46 翠羽衣斑 宫廷服饰
47 玉佩 仪饰
61 公衮 官服
78 冠切云 冠冕
91 衣冠 礼制
94 布衣岸巾 平民服饰
120 罗纨 丝织品
127 野服黄冠 隐逸服饰
150 幅巾 隐逸服饰
181 金靥 仪饰
191 羽衣 仙服
209 生绡 丝织品
244 短蓑 隐逸服饰
250 霓裳 宫廷乐舞服饰
259 宫衣缥缈 宫廷服饰
262 铁衣 军服
267 乌丝、翠褏 丝织品
276 羽衣 仙服
280 着羽衣 仙服
281 凌波罗袜 女性服饰
295 霓裳(杨妃事) 宫廷服饰
296 紫罗香囊 仪饰
313 宫衣 宫廷服饰
315 仙衣、宫腰 仙服/女性服饰
317 宫罗、妆鬟 女性服饰
319 鹔鹴裘 裘服
325 缕金裙 女性服饰

Step 7: 分类整理

按七大类整理:裘衣御寒、隐逸服饰、宫廷贵妇、仪饰佩物、丝织品、官服礼制、道教仙服

Step 8: 保存三份文件


关键发现

  1. 服饰非核心主题:《萧闲老人明秀集注》为词集,服饰内容主要通过典故引入,而非正面描写
  2. 隐逸服饰最为突出:蓑衣、纶巾鹤氅、幅巾、野服黄冠等出现频率高,与蔡松年"倦游思归"核心主题一致
  3. 裘服意象丰富:紫貂裘、锦宫裘、鹔鹴裘,多与"典裘换酒"豪放意象相关
  4. 魏注保存文献:魏道明注引《礼记》《说文》等典籍服饰记载,如佩玉等级、黄冠野服制度等
  5. 宫廷服饰多在咏史:霓裳羽衣、宫衣等出现在咏杨贵妃等历史题材词中
  6. 南北服饰交融:紫貂裘为北方民族贵重裘服,与中原纶巾鹤氅形成对照

踩坑记录

  1. 文件编码问题:文件使用CRLF换行符且行极长(960字符),sed/cut等工具在截断多字节UTF-8时会出错,需改用Python处理
  2. 关键词噪音:"衣""冠""带"等单字在古文中极为常见,需二次筛选排除虚词用法(如"衣冠"代指仕宦、"带"作动词等)
  3. 菟裘非裘:第39行"菟裘"为地名(鲁隐公养老之地),非服饰,需甄别
  4. 注与正文交织:正文与注释以【】分隔,但同在一行,提取时需区分正文词句与注文引典

审核结果

全部通过 — 原文均从源文件grep/sed提取,有明确行号对应,分类合理,无虚构内容。