《陈清端公文选》服饰内容提取·操作日志

任务ID:batch17-3 时间:2026-04-17 输入:/home/z/my-project/upload/四库别集/陈清端公文选.txt 输出:/home/z/my-project/upload/四库别集output/陈清端公文选/


操作流程

Step 0: 环境

Step 1: 读取参考文件

Step 2: 多轮grep搜索(10轮)

第1轮:基础服饰词

rg -n '衣裳|裘|冠|冕|弁|帻|巾帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝绸|缎|绫|罗|纱|绉|缟|缁|素'

命中:释褐(行55)、貂裘(行59)、伪弁(行69)、衣租食税(行126)、白袍/锦衣(行165)、赐冠赐衣(行199)、笏(行201)、御衣/衮衮(行207)、布衣韦带(行211)、尺帛(行215)

第2轮:颜色与首饰词

rg -n '赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇'

命中多为非服饰用(紫阳祠、翠拥、金多等),过滤后无新增有效条目

第3轮:制度类服饰词

rg -n '冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服'

零命中——本书无任何制度类服饰词汇

第4轮:精确服饰词

rg -n '释褐|貂裘|赐冠|赐衣|御衣|白袍|锦衣|布衣|韦带|笏|衣租|尺帛|梳妆|衮衮'

确认12处有效命中

第5轮:细搜冠袍等(排除噪音)

rg -n '冠|袍|裳|裘|褐|衣|带|履|靴|袜|巾|帽|簪|珥|钗|佩' | rg -v '冠军|冠绝|冠盖...'

无新增有效条目

第6轮:诗歌中的服饰词

rg -n '衣|裘|冠|袍|裙|带|巾|履|帛|绢|纱|绫|缎|锦|绣'

诗歌部分仅存目录标题,正文未收录

第7轮:武服/甲胄

rg -n '鍪|甲|盔|弓|刀|剑|戟|兵'

新增:拔鍪(行207)、甲戌(行53,非服饰)

第8轮:纺织材料

rg -n '丝|帛|绢|绸|缎|缯|布|褐|麻|葛|绵' | rg -v '丝粟|布衣|布政...'

新增:衣不蔽体(行112)、尺帛(行215)已收

第9轮:汇总精确词

rg -n '幞被|衣不蔽体|赐冠|赐衣|释褐|貂裘|白袍|锦衣|御衣|布衣韦带|尺帛|朱泚之笏|衮衮|梳妆|拔鍪'

确认最终12处有效命中

第10轮:清代官服特有词

rg -n '缟|缁|素服|青衿|朝衣|官服|吏服|军服|戎服|戎衣|武冠|武弁|花翎|顶戴|孔雀|仙鹤|官帽|乌帽'

零命中

Step 3: 噪音过滤

原始匹配 判定 原因
伪弁(行69) ❌排除 弁指武官,非服饰
甲戌(行53) ❌排除 甲为天干,非甲胄
丝粟(行55) ❌排除 喻微小,非丝织品
紫阳祠(行59) ❌排除 祠名,非紫色服饰
翠拥(行241) ❌排除 景色描写
衮衮(行207) ❌排除 "公侯衮衮"为多义,非衮服
梳妆(行241) ❌排除 景点名"双髻梳妆"
衣租食税(行126/188) ⚠️保留 含"衣"但为成语
幞被(行57) ✅保留 幞为包裹之物,与幞头同源

Step 4: 分类整理

有效服饰条目12处,分5类:

  1. 御赐服饰(3条):貂裘、御衣、赐冠赐衣
  2. 士人意象(4条):释褐、白袍、锦衣、布衣韦带/圭组
  3. 民生疾苦(2条):衣不蔽体、衣租食税
  4. 礼仪器物(1条):笏
  5. 其他(2条):幞被、尺帛

Step 5: 写3个MD文件


关键发现

  1. 本书服饰信息极度匮乏:10轮grep覆盖80+关键词,仅得12处有效命中
  2. 零制度性记载:无舆服、冠服、品色、赐服等任何服饰制度词汇
  3. 御赐服饰最值得关注:貂裘、御衣、赐冠赐衣3条,反映清代帝臣服饰赏赐实践
  4. **"解御衣驰赐"**为特殊事件,康熙帝亲解御衣赐施琅,史料价值高
  5. 服饰意象服务于道德论述:布衣韦带(廉洁)、衣不蔽体(民瘼),非描述性使用

踩坑记录