《苏诗补注》服饰内容提取 · 工作日志
时间:2026-03-04 任务:提取《苏诗补注》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/四库别集/苏诗补注.txt(9394行,1,984,019字节)
操作流程
Step 1: 确认源文件与创建输出目录
wc -l 苏诗补注.txt → 9394行
wc -c 苏诗补注.txt → 1,984,019字节
mkdir -p /home/z/my-project/upload/四库别集output/苏诗补注/
Step 2: 读取参考模板
读取 /home/z/my-project/upload/参考/ 下三个模板:
- 总结.md(吕氏春秋服饰总结范例)
- 日志.md(晋会要工作日志范例)
- 原文提取.md(天工开物原文提取范例)
Step 3: 服饰关键词频次统计
对源文件执行逐关键词grep -c统计:
| 关键词 | 出现次数 | 关键词 | 出现次数 | 关键词 | 出现次数 |
|---|---|---|---|---|---|
| 衣 | 330 | 冠 | 194 | 罗 | 191 |
| 甲 | 154 | 带 | 129 | 锦 | 128 |
| 丝 | 106 | 布 | 104 | 履 | 115 |
| 巾 | 95 | 佩 | 66 | 裘 | 65 |
| 袖 | 55 | 绣 | 55 | 裙 | 36 |
| 绮 | 34 | 袍 | 30 | 裳 | 30 |
| 屦 | 29 | 襟 | 28 | 褐 | 24 |
| 帽 | 26 | 屐 | 26 | 绶 | 16 |
| 冕 | 22 | 纱 | 22 | 绢 | 15 |
| 帛 | 14 | 缟 | 17 | 舄 | 10 |
| 袜 | 10 | 弁 | 11 | 帻 | 7 |
| 靴 | 3 | 鞋 | 8 | 绫 | 8 |
| 绸 | 3 | 布衣 | 9 | 深衣 | 3 |
| 朝服 | 2 | 法服 | 2 | 朝衣 | 1 |
| 道服 | 1 | 儒服 | 1 |
注意:许多高频词(如"衣""带""甲")存在大量非服饰用法,需人工甄别。
Step 4: 高精度复合词检索
用grep -n搜索高精度服饰复合词,命中约80余处明确服饰内容:
主要命中关键词:
- 氊裘(2)、貂裘(4)、鹿裘(1)、羊裘(1)、鹔鹴裘(1)、乌裘(1)、木绵裘(1)
- 白袍(2)、青袍(4)、柘袍(1)、锦袍(2)
- 冕旒(1)、进贤冠(1)、武弁(1)、章甫(1)、黄冠(2)
- 玉佩(2)、簪缨(1)、簪笏(2)、簪绂(1)、金带(2)、玉带(3)
- 缟裙红袂(1)、白纻(2)、红裙(2)
- 深衣(2)、布衣(3)、短褐(2)、衲衣(1)、鹤氅(1)、法服(1)、道衣(2)
- 中单(1)、牛衣(1)、古贝布(1)、黎衣冠(2)
Step 5: 上下文提取与分类
使用sed -n按行号提取上下文片段,逐一甄别是否为服饰内容。剔除以下非服饰用法:
- "衣"用作动词(如"衣之")或地名(如"青衣江")
- "带"用作"携带"义
- "甲"用作"甲子""甲兵"等
- "冠"用作"冠军""冠绝"义
- "罗"作姓氏或"罗列"义
最终确认约65处明确服饰内容,分9大类整理。
Step 6: 保存三份文件
- 苏诗补注_总结.md(分类总结,约12KB)
- 苏诗补注_日志.md(本文件,工作记录)
- 苏诗补注_原文提取.md(原文摘录)
关键发现
- 苏轼服饰意象丰富:裘类出现最多(氊裘、貂裘、鹿裘、羊裘、鹔鹴裘),与苏轼一生游历寒地的经历吻合
- 查慎行注保存大量服饰史料:如宋代服带制度(金带六种)、袍服色制(有官皂袍无官白袍)、深衣制度(礼记纯缘之制)
- 民族服饰记载有价值:黎衣冠(海南黎族服饰)、古贝布(棉布)、氊裘(西戎之服)
- "玉带换衲裙"为关键意象:行4639-4642,苏轼以官服玉带换僧人衲裙,象征弃官归禅
- "衣冠"高频出现:多为"衣冠之盛""衣冠挂神武"等,反映宋代士大夫对仕途进退的关注
- 服饰与人生轨迹对照:早期裘马轻狂(貂裘鲜)→中期青袍困顿(行在窘青袍)→后期鹤氅道衣归隐
关键踩坑记录
- "青衣"多为地名(青衣江、青衣县),非服饰用法,需仔细甄别
- "罗"字191次出现,绝大多数为"罗列""网罗"义,非丝织品
- "甲"字154次出现,多为"甲兵""甲子"义,仅少量为铠甲
- "带"字129次出现,多为"携带""连带"义,仅少量为腰带
- "衣"字330次出现,大量为"衣冠""衣服"泛指,需逐一判断
- 源文件为繁体字(如氊裘、縁、絋等),搜索时需注意异体字
审核结果
全部通过 ✅ — 原文均从源文件grep提取,有明确行号对应。非服饰用法已甄别剔除。