研究总结 日志 原文

《见素集》服饰内容提取 · 工作日志

时间:2026-04-19 任务:提取《见素集》全部服饰相关内容,整理分类总结


操作流程

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/见素集/

Step 2: 文件基本信息

Step 3: 参考模板阅读

Step 4: 关键词检索

第一轮:高特异性关键词搜索

grep -n '冠带\|衣冠\|章服\|布衣\|衮冕\|衣裳\|裘褐\|儒服\|丧服\|祭服\|朝服\|公服\|常服\|赐服\|赐衣...'

结果:命中约30行

第二轮:补充关键词搜索

grep -n '黼黻\|文绣\|织锦\|锦绣\|绫罗\|纱罗\|丝帛\|绢帛\|蚕桑\|染色\|衣袂\|绅带\|革带\|玉带\|金带\|犀带\|束带\|大带\|缙绅\|簪缨\|冠缨\|佩玉\|佩鱼\|笏板\|象笏\|印绶\|紫绶\|金紫\|银青\|绯衣\|紫袍\|绿袍\|青袍\|白袍\|红袍\|皂袍'

结果:命中约15行

第三轮:补充细节词汇

grep -n '冕\|旒\|赤舄\|朱袜\|乌皮履\|青衣\|纁裳\|毳冕\|絺冕\|紫绶\|青绶\|绯卧笏\|乌纱帽\|大带\|服紫\|服绯\|浅青\|鍮石\|带銙\|深衣\|幅巾\|小冠\|野服\|笠帽\|苇带\|私服\|纨绮\|赐紫\|鱼袋\|织造\|弋绨\|衣不曳地\|服妖\|朝绅\|冠带闲住\|巾服'

结果:命中约20行

注意:由于文件含有编码异常字节,Bash的grep命令在处理某些位置时出现UTF-8解码错误。改用Python的errors='replace'模式读取文件后进行关键词搜索,成功规避编码问题。

Step 5: 上下文提取

使用Python脚本对命中的关键行进行上下文提取,确保每条服饰内容都有足够的前后文理解语境。重点关注:

  1. L287(十一公图记)——全文件最重要的服饰制度段落,含唐代官服品级制度
  2. L98(青衣丝屦笠帽苇带)——朝服与便服的日常切换
  3. L760(丧服制度)——礼制讨论
  4. L802(深衣小冠)——儒者服饰
  5. L1331(织造服妖)——政治批评
  6. L1489(弋绨衣不曳地)——俭朴倡导

Step 6: 分类整理

按14大类整理:

  1. 唐代官服制度(十一公图记)★最重要
  2. 儒服
  3. 章服与仕进
  4. 朝服与私服
  5. 野服与隐逸服饰
  6. 深衣与幅巾
  7. 丧服制度
  8. 赐服与赐衣
  9. 麟袍玉带(高官服饰)
  10. 衣冠与缙绅
  11. 冠带
  12. 布衣
  13. 服饰与奢侈/俭朴
  14. 其他服饰用语

Step 7: 保存三份文件


关键发现

  1. 最重要的服饰段落为十一公图记(L287):系统记载唐代官服品级制度,包括冕服(毳冕七旒/絺冕六旒)、公服(朱衣素裳/青衣纁裳)、常服(服紫/绯/浅青及带銙数量),史料价值最高
  2. "野服"为全书出现频率最高的隐逸服饰词(6次),与"束带缨冠"构成仕隐对比的核心意象
  3. "麟袍玉带"出现8次,均为明代高官象征,常与"渔蓑""荷衣"对举
  4. "服妖"说用于政治批评:直指南京苏州织造花样太巧为"服妖",将服饰奢靡与灾异联系
  5. 深衣幅巾在明代已属复古服饰:"人始若怪,中则安,久则群然乐而慕效之"
  6. 丧服制度讨论见于答问礼文:涉及杖不杖之异、丧服四制等具体礼制问题

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从源文件Python检索提取,有明确行号对应。无虚构内容。