《耕学斋诗集》服饰内容提取 · 操作日志
时间:2026-03-04 任务:提取《耕学斋诗集》全部服饰相关内容,整理分类总结 文件:/home/z/my-project/upload/四库别集/耕学斋诗集.txt(2217行)
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/耕学斋诗集/
Step 2: 读取参考模板
读取 /home/z/my-project/upload/参考/总结.md → 吕氏春秋总结模板(分类+表格)
读取 /home/z/my-project/upload/参考/日志.md → 晋会要日志模板(步骤+踩坑)
读取 /home/z/my-project/upload/参考/原文提取.md → 天工开物原文模板(按类+行号引用)
Step 3: 源文件基本信息
wc -l 耕学斋诗集.txt → 2217行
sed -n '1,5p' → 耕学斋诗集 明 袁华 / 钦定四库全书
Step 4: 关键词检索(分三轮)
第一轮:宽泛搜索
grep -n '衣|裳|冠|冕|弁|帻|巾|帽|履|鞋|袜|裘|袍|褐|衫|裙|带|绶|佩|笏|簪|缨|钿|钗|环|珮|锦|绣|绢|绫|罗|纱|缎|绸|帛|丝|麻|葛|布|绵|毡|绒|氅|褂|袄|裾|袂|袗|襦|襕|衿|裎|褶|袴|褲|裈'
→ 256行命中
第二轮:精确搜索
grep -n '衣裳|衣冠|布衣|锦衣|青衣|白衣|朱衣|黄衣|玄衣|法服|朝服|祭服|丧服|衮服|深衣|皮弁|冠冕|龙袍|衮衣|裘|袍|褐|衫|裙|绶|笏|簪|缨|钿|钗|珮|锦|绣|绢|绫|罗|纱|帛|氅|褂|袄|袂|襦|襕|衿|袴|裈|冠带|佩玉|衣袂|缁衣|貂|狐裘|羔裘|鹿裘|狐白|狐腋'
→ 118行命中
第三轮:分类检索
- 衣物类(衣/裳/袍/裘/褐/衫/裙/袄/襦/袴/裈/氅/褂):约80行
- 冠履饰品类(冠/冕/弁/帻/巾/帽/簪/缨/钗/钿/环/珮/绶/笏/履/鞋/袜/靴):约60行
- 纺织类(蚕/桑/茧/织/缫/纺/丝/绵/布/帛/绢/绸/绫/缎/罗/纱/锦/绣):约135行
Step 5: 逐条审读与筛选
通过sed提取关键行上下文,逐一判断是否为真正服饰内容,排除:
- "衣"在非服饰语境中的用法(如"衣钵"为禅宗术语、"衣冠"为官员代称等仍保留)
- "带"在"带方""带领"等非腰带语境(L667"带方东"为地名,已排除)
- "丝"在"丝弦""蛛丝"等非服饰语境(L119"丝光莹蜡"为灯烛描写,已排除)
- "环"在非佩饰语境
Step 6: 分类整理
最终确定7大类别:
- 斑衣彩服(孝亲服饰)——全书最突出特色,约10处
- 衣冠官服——朝仪/监察/科举/武官,约15处
- 女性服饰——闺阁/歌舞妓,约20处
- 蚕桑织锦——生产流程/祭服,约8处
- 僧道隐逸——方袍/羽衣/野服/鹿皮冠,约8处
- 布衣平民——短布单衣/布衣/短衣,约6处
- 少数民族——椎结/柘袍/吐鹘装/卉服,约4处
Step 7: 保存三份文件
- 耕学斋诗集_原文提取.md(按类别+行号引用)
- 耕学斋诗集_总结.md(分类汇编+表格)
- 耕学斋诗集_日志.md(本文件)
关键发现
- 斑衣彩服为全书最突出的服饰意象:共出现约10次,全部与孝亲娱亲相关,是袁华诗歌的特色意象
- L949"彩服染缁尘"句最为精妙:从彩服→缁尘→敝→恩赐朱衣新→"俯视儿身衣犹是母手缝",五层转折
- L1067四迷图是女性服饰描写最集中的段落:寳钗、罗韈、锦裾绣袂、金条脱、翠钿、钗荆裙布,极尽华靡与素朴对比
- L823完颜巾歌为金代服饰特色记载:柘袍、吐鹘装、小乌纱等金人服饰术语在诗集中较少见
- L1101"三吴蚕缫甲天下"至"黼黻文章成祭服":将蚕桑生产与祭服制度连接,有实际的衣料生产描写
- 整体以文学意象为主:与礼制文献不同,诗集服饰多为抒情意象,制度性信息较少
关键踩坑记录
- "衣"字大量出现于非服饰语境,需逐一甄别(如"衣钵""百衣"等)
- L667"带方东"为地名(带方郡),非腰带
- L823"吐鹘装"为金人特有服饰术语,需查阅背景方知
- L177"觧制乌纱帽"为辞官意象,"制"疑为"卸"之意
- L833-835"毛袜"为戏谑诗,非严肃服饰描写,但仍收录
- 部分字有特殊编码如■〈髟上委下〉■〈髟上隋下〉,为古籍OCR之髻/鬟类字
- 部分行"绣"字用于"绣球"(L419)等植物名,非刺绣
审核结果
全部通过 ✅ — 原文均从耕学斋诗集.txt中grep -n检索提取,有明确行号对应。无虚构内容。