研究总结 日志 原文

《荒政丛书》服饰内容提取 · 操作日志

时间:2026-03-05 任务:从《荒政丛书》TXT中提取全部服饰相关内容,产出3MD 输入:/home/z/my-project/upload/zhengshu/政书/荒政丛书.txt 输出:/home/z/my-project/upload/政书重制output/荒政丛书/


文件基本信息

项目
文件名 荒政丛书.txt
行数 853行
字节 385,487字节(约377KB)
性质 明清荒政文献汇编,非服饰专书
单行特点 政书单行极长(可达4000+字),sed提取需注意上下文完整

检索流程

第1轮:核心服饰词全搜

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣'

命中行数:148行(含大量误命中需人工过滤)

第2轮:制度动作词搜索

rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠'

命中行数:0行

第3轮:按需扩展词搜索

rg -n '荆钗|裙布|纨|缙绅|搢绅|布衣|衣冠|衣裘|缁衣|鲜衣|衣禁|衣布|衣罗|衣七緵|布帛|丝绢|丝绵|农桑|蚕|桑|茧|织|纺'

命中行数:约60行(含重复与误命中)


误命中排除记录

关键词 误命中场景 处理
"衣食"合称=民生泛指(行528等20+处) 排除——非服饰具体描述
"衣布搢本"=荒年礼制 保留——含服饰制度信息
"衣罗纨""衣宝玉""衣七緵布" 保留——描述具体穿着行为
"衣服率从贸易" 保留——涉衣料贸易制度
"冠军""冠绝" 未出现
"冠带荣身""给与冠带" 保留——首服制度
"冠婚丧祭" 保留——冠礼制度
"带领""地带" 排除——非腰带义
"冠带"合称 保留——首服+腰带
"布帛市谷""宫中用帛" 保留——丝帛经济制度
"帛书""帛画" 未出现
"麻制"=翰林诏书 未出现
"如麻"=比喻 排除——非衣料
"罗列"=排列 未出现
"衣罗纨" 保留——丝织品
"环境""环能" 未出现
"蚕丝""丝绢""丝绵" 保留——丝织品
"丝银"=银两成色 排除——非丝织品
"宣布""分布" 排除——非布料
"巾布""布帛""七緵布" 保留——布料
"锦绣" 保留——丝织品
"服从""服药""服田" 排除——非服饰义
"素服""野服""冠服" 保留——服饰
"履历""履行" 排除——动词义
"芒履""徒跣" 保留——足服

最终有效提取统计

分类 有效条目数 涉及行号
荒年天子减服 3 208
冠带荣身奖赏 7 199, 258, 298, 348, 408, 418, 482, 486, 530, 531, 627
冠婚丧祭礼制 2 334, 350
纺织农桑衣料 5 83, 196, 346, 347, 460, 464, 485
服饰与民生 3 426, 480, 482
服饰杂见 4 211, 215, 216, 827
合计 22

关键踩坑记录

  1. 政书单行极长:本书853行但有385KB,单行可达4000+字,sed提取上下文时需确保完整
  2. "冠带"高频出现:本书"冠带"作为荒政奖赏手段出现7+次,非服饰专义而是制度用语,但涉及服饰等级制度,予以保留
  3. "衣"大量泛指用法:"衣食"合称在荒政文献中极为常见(20+处),均排除;仅保留具体描述穿着行为的用例
  4. "丝银"非丝织品:常平仓议中"丝银"指银两成色标准,非丝织品,已排除
  5. "布衣"仅1处为服饰义:朱熹社仓记"自为布衣"为平民代称,不含具体服饰信息,未收录

文件产出

文件 大小 状态
荒政丛书_总结.md ~7KB
荒政丛书_日志.md ~4KB
荒政丛书_原文提取.md ~6KB 待产出