《竹斋诗集》服饰内容提取 · 日志
时间:2026-04-19 任务:提取《竹斋诗集》全部服饰相关内容,整理分类总结 任务ID:batch5-5
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/竹斋诗集/
Step 2: 读取参考模板
读取 /home/z/my-project/upload/参考/原文提取.md(天工开物模板)
读取 /home/z/my-project/upload/参考/总结.md(吕氏春秋模板)
读取 /home/z/my-project/upload/参考/日志.md(晋会要模板)
Step 3: 文件基本信息
wc -l 竹斋诗集.txt → 537行
- 三卷诗 + 附录(诰敕、墓志铭、奏疏、跋等)
- 作者:宋·裘万顷(字元量,号竹斋)
Step 4: grep关键词检索
grep -n '衣|裳|冠|冕|袍|裘|带|佩|履|舄|簪|笄|巾|帻|弁|襦|褐|锦|绮|绢|帛|绫|罗|缎|丝|麻|葛|绶|黼|黻|绣|纹|绛|绯|紫|青|朱|玄|黄|白|裳服|冠服|衣冠|服色|衮|帔|褙|袄|裙|裤|襕|深衣|道服|鹤氅|巾帽|鱼袋|玉带|金带' 竹斋诗集.txt
- 初次检索命中约200行(含大量人名、地名、颜色词等误命中)
Step 5: 去噪过滤
排除以下类型误命中:
- 人名:裘万顷、裘元量、裘司直、裘君(约15处)
- 地名:锦县
- 器物/音乐:丝桐(琴)、丝与竹(乐器)、钓丝
- 颜色非服饰:朱墨(红墨)、紫苔、骊黄、青青、绿隂
- 神名:玄冥
- 成语/典故非服饰:箕裘(祖业)、不下带(不出常道)、衮衮(众多)
- 其他:带雨、带月(携带)、脂韦(阿谀)
过滤后有效服饰相关条目:约20处
Step 6: 逐条提取上下文
使用 sed -n '行号p' 提取每条匹配的完整诗句,并获取对应的诗题。
Step 7: 分类整理
按8大类整理:
- 衣裳类(9条)
- 冠巾类(8条)
- 官服绶带类(6条)
- 丝织品类(6条)
- 佩饰玉器类(2条)
- 军戎甲衣类(1条)
- 鞋履类(3条)
- 歌舞服饰类(1条)
Step 8: 生成三份MD文档
- 竹斋诗集_原文提取.md(5,800字)
- 竹斋诗集_总结.md(3,200字)
- 竹斋诗集_日志.md(本文件)
关键发现
- 《竹斋诗集》为诗歌体裁,服饰内容以诗句意象形式散见,无系统性服饰制度论述
- 幅巾意象最为突出,出现3次,构成诗人"吏隐"身份的核心服饰符号
- 官服色彩完整:青衫(八九品)→绿绶(六品以下)→黑绶(县令)→朱绂(四五品),反映宋代官品服色制度
- 端午换夏服民俗:"细葛香罗素无望"为珍贵的宋代端午服饰民俗记录
- "绮罗丛里度平生"咏针:以针穿绮罗为喻,构思新颖,为宋诗咏物佳作
去噪踩坑记录
- "裘"字在本诗集中大量出现为人名(裘万顷、裘元量等),需严格区分"裘"作为服饰(一裘或终身)与作为姓氏
- "青衫"在宋代既是官服色也是文学作品中的经典意象,需判断是否为服饰描写
- "带"字大量出现为动词(带雨、带月、带冰),需筛选仅保留服饰意义的"带"(绶带、革带)
- "罗溪桥""罗朝宗"中的"罗"为地名/人名,非丝织品
- "绣""纹"等字在本诗集中未出现与服饰相关的内容
- "黄""白""紫""朱"等颜色词大量用于非服饰语境(黄花、白鸥、紫苔、朱墨等),仅保留明确与服饰搭配者
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应,去噪过滤严格。