《竹斋集》服饰内容提取 · 日志
时间:2026-03-05 任务:提取《竹斋集》全部服饰相关内容,整理分类总结
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/竹斋集/
Step 2: 确认文件信息
wc -l 竹斋集.txt → 9155行
文件为明·王冕撰《竹斋集》,以诗歌为主,末附传记3篇。
Step 3: Grep检索服饰关键词
grep -n '衣|裳|冠|冕|袍|裘|带|佩|履|舄|簪|笄|巾|帻|弁|襦|褐|锦|绮|绢|帛|绫|罗|缎|丝|麻|葛|绶|黼|黻|绣|纹|绛|绯|紫|青|朱|玄|黄|白|裳服|冠服|衣冠|服色|衮|帔|褙|袄|裙|裤|襕|深衣|道服|鹤氅|巾帽|鱼袋|玉带|金带' 竹斋集.txt
→ 729行匹配(含大量颜色词非服饰用例)
Step 4: 精筛服饰关键词
使用更精确的关键词组合(排除纯颜色词如"青山""白云"等):
grep -n '衣冠|衣裳|冠服|龙袍|貂裘|季子裘|牛衣|草衣|麻衣|敝衣|典衣|脱巾|乌巾|葛巾|簪冠|獬豸冠|竹冠|绣衣|锦衣|绮衣|罗衣|羽衣|深衣|朱衣紫绶|绯|绫|绢|纨|裘|袍|裙|袄|佩|绶|黼黻|华衮|环佩|翠裳|罗裳|丝|帛|赐衣|冠带|幅巾|纱帽|罗帷|锦障|锦帆|锦绣|纨绮|菟裘|青绫|罗绮' 竹斋集.txt
→ 约100行有效服饰匹配
Step 5: Sed提取上下文
对约90个关键行号,使用 sed -n 'start,endp' 提取前后5行上下文,确认诗题与语义。
Step 6: 分类整理
按8大类整理:
- 冠帽类(竹冠、獬豸冠、巾帻、葛巾、幅巾、纱帽、冠带、大帽)
- 衣衫类(龙袍、绣衣、锦衣/锦袍、青衫、羽衣、绮衣、朱衣紫绶、深衣、罗衣、草衣、麻衣、敝衣、衣冠、衣裳、寒衣/襦、古冠服)
- 裘皮类(貂裘、季子裘、牛衣、菟裘、鳞花裘)
- 丝织品类(吴绫蜀锦、青绫、绮、罗、绢、锦绣/锦障/锦帆)
- 佩饰类(环佩、佩、绶、簪)
- 履舄类(舄、杖履)
- 礼制服饰(赐衣节、黼黻华衮、轩冕、玉帛、绯)
- 纺织民生(织麻/丝税、丝、布衣、桑麻)
Step 7: 保存三份文件
/home/z/my-project/upload/四库别集output/竹斋集/原文提取.md/home/z/my-project/upload/四库别集output/竹斋集/总结.md/home/z/my-project/upload/四库别集output/竹斋集/日志.md(本文件)
关键发现
- "竹冠草衣"是王冕的核心服饰意象:出现5次,构成其隐士身份标志,与官服体系形成对峙
- "衣冠"为最高频服饰复合词:约14次,含士大夫阶层、文明教化、沦丧对比三重意蕴
- 服饰贫富对比极为鲜明:锦绣罗帷vs敝衣裂襦,是王冕社会批判的主要手法
- 传记中的服饰极具个性:"古冠服""大帽如簁",以奇装异服表达政治立场
- 缺乏制度性服饰记载:与《吕氏春秋》《晋会要》等不同,《竹斋集》为纯文学文本,无礼仪制度描写
- 颜色词多为非服饰用例:青山、白云、黄叶、紫驼等约600+条颜色词匹配实际与服饰无关
关键踩坑记录
- 关键词初筛729行,大量为颜色词非服饰用例(如"青山""白云""黄叶"),需二次精筛
- "衣冠"在诗中多为复合词代指士大夫阶层,非指具体衣帽
- "纨胯"为"纨袴"异写,指纨绔子弟(第7139行)
- 第9117行■为「衣」中加「回」,即「裈」字异体(见原注)
- "菟裘"为地名/隐居代称,典出《左传》,非实际裘衣
- "约裤"(第7415行)疑为"纨裤"之讹
审核结果
全部通过 ✅ — 原文均从竹斋集.txt中grep+sed提取,有明确行号对应。