《西曹秋思》服饰内容提取 · 工作日志
时间:2026-04-19 任务:提取《西曹秋思》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/四库别集/西曹秋思.txt
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/西曹秋思/
Step 2: 检查源文件
wc -l 西曹秋思.txt
→ 837行
Step 3: 阅读参考模板
读取 /home/z/my-project/upload/参考/ 下三个模板:
- 总结.md(吕氏春秋模板)
- 日志.md(晋会要模板)
- 原文提取.md(天工开物模板)
Step 4: grep搜索服饰关键词
使用以下关键词组合搜索:
grep -n '衣|裳|冠|冕|裘|袍|带|佩|履|鞋|袜|巾|帽|簪|笏|绶|绣|锦|绮|罗|绢|绸|缎|纱|帛|丝|麻|葛|褐|毡|裙|袂|领|袖|衿|襟|袴|裤|襦|袄|衮|弁|帻|黼|黻|旒|纩|缨|缟|绯|紫' 西曹秋思.txt
→ 89行命中
精简为核心服饰词汇分批搜索:
- 衣:21行
- 裘:2行
- 冠:14行
- 褐:2行
- 帽:4行
- 襟/袖/衫/裙:18行
- 履/屦/屐:8行
- 绶/佩/带:16行
- 绣/锦:8行
- 簪/弁/帻/缨:6行
- 絺/葛/苎:8行
- 笠/蓑/箬:6行
- 舄:2行
- 衲:2行
- 绦:2行
Step 5: 发现文件结构
diff 前半段(1-420行) vs 后半段(421-837行)
→ 前后内容基本重复,后半段署"辛德勇校",前半段末附四库提要
→ 仅以前半段(1-420行)为工作对象,去重处理
Step 6: sed提取上下文
对前半段42个关键行号,使用 sed -n 'start,endp' 提取前后上下文(前1行+后2行),获取完整诗句和校异注释。
Step 7: 分类整理
将服饰内容按15类整理:
- 锦衣
- 衣冠/荷衣/寒衣/箬衣/解衣/衣袖/衣鱼/瓦衣
- 冠(南冠/冠猿/正冠/挂冠/鹿皮小冠/缨冠)
- 帽(皂帽)
- 裘(绮裘)
- 衫(春衫/征衫/单衫/绿衫)
- 褐(短褐)
- 佩/绶/绦/带
- 舄履/屦/屐
- 笠/缨
- 衲
- 襟/袖
- 绣/锦
- 絺/葛/苎/布
- 异体字【衣+丘】
Step 8: 保存三份文件
- 西曹秋思_原文提取.md(15,223字节)
- 西曹秋思_总结.md(5,484字节)
- 西曹秋思_日志.md(本文件)
关键发现
- 《西曹秋思》为倡和诗集,非制度性文献,无专门的服饰记载
- 服饰词汇全部为文学修辞,以典故、隐喻方式服务于抒情言志
- 核心意象两极对立:囚徒(南冠、锦衣)vs 隐士(荷衣、皂帽、鹿皮冠)
- 贫寒意象突出:短褐、单衫、布被、葛屦、衣袖萧然
- 典故来源集中:《左传》(南冠)、《楚辞》(荷衣、濯缨)、《诗经》(赤芾)、三国(皂帽/管宁)、东汉(挂冠/逢萌)
- 无史料价值:所有服饰信息均为文学化使用,不具备服制、工艺、材料等方面的史料参考价值
关键踩坑记录
- 文件前后半段内容重复(837行中前420行为正文+校异+附录,后417行为校勘版),须去重处理
- "衣鱼"(蠹鱼/蛀虫)和"瓦衣"(苔藓)含"衣"字但非服饰名词,需甄别
- "履虎"(履虎尾)非鞋履义,为《易经》典故
- "分襟""带雨"等词中"襟""带"为修辞用法,非实物服饰
- "罗"字多处出现但均为"罗网""罗吏""罗溪"等非织物义
- "绣苔"之"绣"为形容词(如绣),非织绣工艺
- 行239有异体字【衣+丘】,须特别标注
- 行97"赤芾"为大夫服饰(蔽膝),是全书最有制度性价值的服饰词汇
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应,去重后仅录前半段(1-420行)。服饰词汇的文学用法与实物用法已逐一甄别标注。