《豫章文集》服饰内容提取 · 操作日志
任务ID:batch3-5 时间:2026-04-19 输入:/home/z/my-project/upload/四库别集/豫章文集.txt(1067行) 输出:/home/z/my-project/upload/四库别集output/豫章文集/
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/豫章文集/
✅ 目录创建成功
Step 2: 读取参考文件
- 读取
参考/总结.md(吕氏春秋服饰汇编,261行) - 读取
参考/日志.md(晋会要服饰提取对话记录,84行) - 读取
参考/原文提取.md(天工开物服饰原文提取,165行)
确认输出格式:总结(分类+表格+要点)、日志(流程+关键发现)、原文提取(逐条原文+行号)
Step 3: 源文件概况
豫章文集.txt:1067行
作者:宋·罗从彦(豫章先生),道学家
内容:遵尧录8卷 + 语录 + 杂著 + 诗 + 附录 + 外集
Step 4: 多轮grep搜索
第1轮:基础服饰词(衣裳裘冠冕弁帻巾帽袍衫裙裤褐)
grep -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐'
命中行:132, 137, 142, 150, 160, 168, 169, 171, 172, 175, 177, 178, 179, 180, 198, 221, 223, 233, 236, 252, 266, 298, 299, 309, 310, 312, 320, 333, 338, 339, 340, 343, 347, 349, 355, 359, 362, 364, 366, 369, 374, 379, 380, 403, 407, 414, 419, 421, 435, 453, 472, ...
大量命中("衣""冠""巾"等高频字词误命中多),需二次筛选。
第2轮:织物与色彩词(衮绶佩笏带锦绮绢帛丝绸缎绫罗纱绉缟缁素赤青黄白黑朱紫绯绿翠金银玉珠簪钗钿珥)
命中行更密集,"素""赤""青""黄""白""黑""金""银""玉""珠"等高频色词误命中极多。 有效提取:绶(无)、佩(816韦佩)、笏(233搢笏/338秉笏)、绢(179/180赐绢)、缁(869缁京洛尘)、紫(347/349紫服/紫章服)、绯(822绯鱼袋)、翠(169铺翠)、金紫(237/407赐金紫)、珠(142真珠鞍)。
第3轮:专有服饰词(冠服舆服章服朝服公服祭服丧服常服戎服赐服蟒衣飞鱼斗牛补服品色鱼袋革带玉带金带幞头乌纱进贤冠深衣大带蔽膝舄履靴袜霞帔翟衣蚕服)
命中极少,有效提取:鱼袋(822绯鱼袋/347佩鱼)、舄(178/568/618赤舄几几)、履(223履舄)、靴→鞾(223胡服之鞾)。
第4轮:补充搜索(袍带/襦/搢笏/秉笏/布衣/羽衣/贴绣/赐紫/赐金紫/朝绅/角巾/簪绅)
命中有效条目:袍带(171)、贴绣铺翠襦(169)、搢笏(233)、秉笏(338)、布衣(142/863)、羽衣(180/379/380)、赐紫(347)、赐金紫(237/407)、朝绅(869)、乌角巾(869)、簪绅(990)。
Step 5: 过滤噪音
去除以下类型误命中:
- "衣"作"衣食"泛指(行221/548等,非服饰专指)
- "冠"作"冠军"(无命中)
- "素"作"素来"等虚词用法
- "赤子"(行366等,非服饰)
- "黄"作地名/年号
- "玉"作"玉帛"泛指财物(行137/141等)
- "金帛"泛指赏赐物(行150/175/299/312/453等,非服饰专指)
最终保留有效服饰条目 25条。
Step 6: 分类整理
按六大类整理:
- 服制制度与礼法(5条)
- 品服与章服(6条)
- 赐衣与袍带礼仪(6条)
- 服饰象征与德行(4条)
- 奢俭与服饰(3条)
- 诗文服饰意象(4条)
Step 7: 写入3个MD文件
| 文件 | 大小 | 内容 |
|---|---|---|
| 总结.md | ~7KB | 分类总结+表格+核心思想 |
| 日志.md | 本文件 | 操作流程+关键发现+踩坑记录 |
| 原文提取.md | ~8KB | 逐条原文+行号+注释 |
关键发现
太宗服制论述为最核心条目:行223太宗与寇准关于"衣裳冠冕皆有法象""胡服之鞾与古之履舄殊"的对话,是全书唯一正面讨论服制礼法的段落,具有较高史料价值。
赤舄几几三次出现:行178(评赵普)、行568(程颢评安石)、行618(伊川解释),赤舄作为盛德象征反复出现,反映道学家以服饰喻德的思想特征。
佩鱼制度考:行347记载伎术官不得佩鱼以"别士类",行822记载赐绯鱼袋,可佐证宋代佩鱼制度。
铺翠襦禁令:行169太祖禁长公主衣贴绣铺翠襦,与《宋史·舆服志》互证,体现宋初禁奢侈服饰的政策。
服饰内容占比低:全书1067行,有效服饰条目仅25条(约2.3%),且多为政治史事中的附带提及,无专章论述服饰。
踩坑记录
- "衣"字在古文中极高频("衣食""衣冠""布衣"等),首轮搜索命中行数巨大,需逐一甄别是否为服饰专指
- "金帛""玉帛"等词在赏赐记载中频繁出现,但属财物泛指,非服饰专指,需过滤
- "赤子""赤心"中"赤"非色彩服饰用法
- 源文件OCR质量尚可,未发现"衮冕"→"哀冕"等典型讹误
- 部分行号跨行过长(如行592长达数千字),grep匹配后需截取关键句段
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应。有效服饰条目25条,噪音已过滤,分类合理。