《新竹县制度考》服饰提取 · 对话记录
时间:2026-03-05 任务:提取《新竹县制度考》全部服饰相关内容,整理分类总结 输入:/home/z/my-project/upload/zhengshu/政书/新竹县制度考.txt(约125KB,约2600行) 输出:/home/z/my-project/upload/政书重制output/新竹县制度考/
操作流程
Step 1: 读取源文件与词库
- 源文件大小:124,689字节,约2600行
- 词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md
- 参考格式:/home/z/my-project/upload/参考/ 下的三份MD文件
- 已读取参考文件确认输出格式
Step 2: 第1轮 grep——核心服饰词全搜
关键词:衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣
命中行数极多(约80+行),但绝大多数为误命中:
- "丝"→银两计量单位"丝忽"(第617、621、739、837等行)
- "绅"→绅董、乡绅(身份称谓)
- "服"→起服(丁忧期满)、人名(林服)
- "麻"→杨麻(植物名)
- "罗"→人名(罗有生、罗仕生、罗在田)
- "布"→布政司、布广号
- "纹"→无独立命中
- "领"→领取(动词)
- "带"→附带/带领(动词/介词)
真正的服饰命中行仅6处:
- 第81行:轿伞扇夫
- 第511行:棉衣
- 第545行:衣布
- 第687行:轿伞扇夫
- 第703/707/711行:花币旗匾
- 第725行:衣布银
- 第1923/1927/1933行:衣布详细记录
Step 3: 第2轮 grep——制度动作词
关键词:赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠|花币|旗匾|顶戴|花翎
新增命中:
- 第703行:花币旗匾(举人)
- 第707行:花币旗匾(进士)
- 第711行:旗匾(岁贡生)
- 第2087行:赏戴花翎
- 第2513行:头品顶戴
- 第2521行:赏给顶戴匾额
Step 4: 第3轮 grep——补充搜索
关键词:棉衣|衣布|花币|旗匾|顶戴|花翎|扇夫|轿伞|衣食
新增命中:
- 第2525行:"先行核给以衣食"(海难赈济)
Step 5: 排除审查(对抗式)
逐条审查所有命中,排除非服饰语境:
| 排除项 | 原因 |
|---|---|
| "乡绅""绅董" | 身份称谓,非缙绅之绅(腰带) |
| "起服" | 丁忧期满复职,非穿着服饰 |
| "丝忽"中的"丝" | 银两计量单位,非丝织品 |
| "布广号" | 布政司文号,非布匹 |
| "杨麻" | 植物名,非麻布 |
| "罗有生"等人名 | 非丝织品"罗" |
| "领取""承领" | 动词义,非衣领 |
| "带纳""带捐" | 附带义,非腰带 |
| "庄正林服" | 人名"林服",非服饰 |
Step 6: 保存三份文件
- 新竹县制度考_总结.md
- 新竹县制度考_原文提取.md
- 新竹县制度考_日志.md(本文件)
关键发现
- 服饰内容极度稀疏:2600行原文中,严格属于服饰范畴的仅6处,这在政书类文献中属于罕见低值
- 全部为制度性配给:无日常穿着、无衣料工艺、无服色等级,所有服饰信息均属赈恤/赏赐/仪仗制度
- 孤贫衣布银为最大条目:四十六名孤贫人均0.55两/年,虽少但属法定固定支出,编入存留坐支项目
- 花币旗匾属科举佩饰:举人花币旗匾银一两三钱三分三厘,进士二两,反映科举制度中的服饰标志功能
- 顶戴花翎为间接服饰信息:仅出现于官员头衔中,无服饰本体描述
关键踩坑记录
- "丝"在本文献中全部为银两计量单位(丝、忽),无一例指丝织品
- "罗"在人名中频繁出现(罗有生、罗仕生、罗在田等),极易误判为丝织品
- "服"出现于"起服""林服"等非服饰语境,须严格按排除规则审查
- "布"出现于"布政司""布广号",为机构名称而非布匹
- "麻"出现于"杨麻",为植物名称而非麻布衣料
审核结果
对抗式审查通过 ✅
- 所有"丝"字命中已排除(均为银两计量单位)✅
- 所有"罗"字人名已排除 ✅
- 所有"服"字非服饰义已排除 ✅
- 所有"绅"字为身份称谓已排除 ✅
- 所有"布"字为机构名已排除 ✅
- 所有"麻"字为植物名已排除 ✅
- "领""带"动词义已排除 ✅
- 保留项均有明确服饰语境支撑 ✅
原文均从源文件 grep -n 定位后提取,有明确行号对应。