《今言》服饰提取日志
操作员:AI Agent
日期:2026-03-04
输入文件:/home/z/my-project/upload/11111/part1/今言.txt(270862字节,1029行)
输出目录:/home/z/my-project/upload/11output/今言/
一、文件信息
| 项目 |
数值 |
| 文件大小 |
270,862 字节 |
| 总行数 |
1,029 行 |
| 作者 |
明·郑晓 |
| 条目数 |
344条(含附录) |
二、10轮关键词搜索记录
第1轮:衣/裳/服/冠/冕/弁/袍/裘
- 工具:
rg -n '衣|裳|服|冠|冕|弁|袍|裘'
- 原始命中行数:约80+行
- 服饰实质相关:约18行
- 剔除原因:大量"服"字用于"降服""服阕""服劳"等非服饰语境;"冠"多见于人名地名(冠带、冠军等);"弁"仅出现在"武弁"泛指
- 关键命中:第179条尚衣监/巾帽局、第186条革冠服、第197条勿加冕服、第312条龙袍、第922条朝服公服、第934条蟒衣
第2轮:巾/帽/帻/幞头/簪/缨
- 工具:
rg -n '巾|帽|帻|幞头|簪|缨'
- 原始命中行数:6行
- 服饰实质相关:3行
- 剔除原因:"巾帽"多与"局"连用为机构名
- 关键命中:第179条巾帽局、第820条内侍巾帽靴鞋、第1012条角巾布衣
第3轮:帛/绢/绫/罗/绸/缎/锦/绮/丝/麻/葛/褐
- 工具:
rg -n '帛|绢|绫|罗|绸|缎|锦|绮|丝|麻|葛|褐'
- 原始命中行数:约25行
- 服饰实质相关:约10行
- 剔除原因:"丝纶簿"为文书名;"锦衣"为卫所名;"金鱼袋"为交趾官名;"帛"多用于祭祀制帛
- 关键命中:第225条制帛五等、第313条织金彩表纻丝/绢、第820条纻丝纱罗、第922条布帛
第4轮:佩/笏/带/绶/鱼袋/玺/印
- 工具:
rg -n '佩|笏|带|绶|鱼袋|玺|印'
- 原始命中行数:约40+行
- 服饰实质相关:约5行
- 剔除原因:"印"几乎全部为官印/信印语境;"带"多为"带俸""地带";"佩刀"为武器
- 关键命中:第313条金相犀带/花金带/素金带/花银带、第922条袍带、第934条纻丝三表里
第5轮:履/舄/鞋/靴/袜
- 工具:
rg -n '履|舄|鞋|靴|袜'
- 原始命中行数:5行
- 服饰实质相关:3行
- 剔除原因:"操履"为品行义;"履历"为经历义
- 关键命中:第219条麻屦、第313条衣靴帽、第820条巾帽靴鞋
第6轮:舆服/服色/赐服/章服/冠服/品服/朝服/公服/祭服/丧服
- 工具:
rg -n '舆服|服色|赐服|章服|冠服|品服|朝服|公服|祭服|丧服'
- 原始命中行数:6行
- 服饰实质相关:6行(本轮精准度最高)
- 关键命中:第186条革冠服、第273/275条服色许与子同、第364条丧服小记、第387条冠服、第922条朝服/公服
第7轮:绣/纹/黼/黻/章/染/织
- 工具:
rg -n '绣|纹|黼|黻|章|染|织'
- 原始命中行数:约50+行
- 服饰实质相关:约5行
- 剔除原因:"章"字极多但几乎均为"章纶""文章""条章"等非服饰语境;"织"多为"织金""织造"属纺织行政
- 关键命中:第179条内织染局、第293条绣茄袋、第312条织金九龙纻丝、第762条织造
第8轮:裙/衫/袄/褐/帔/褙子/深衣/襕衫
- 工具:
rg -n '裙|衫|袄|褐|帔|褙子|深衣|襕衫'
- 原始命中行数:0
- 说明:全书无此类日常服饰词汇
第9轮:进贤冠/武冠/貂蝉/笼巾/额子
- 工具:
rg -n '进贤冠|武冠|貂蝉|笼巾|额子'
- 原始命中行数:0
- 说明:全书无此类冠帽专称
第10轮:衮/襦/裆/裈/袴/褶/裾/袂/衿/衽/领/袖/襟
- 工具:
rg -n '衮|襦|裆|裈|袴|褶|裾|袂|衿|衽|领|袖|襟'
- 原始命中行数:约15行
- 服饰实质相关:1行
- 剔除原因:"领"几乎全部为"领兵""领职"等动词语境;"袖"未出现;"褶"未出现;"衮"出现在交趾人名中
- 关键命中:第910条正衣襟
三、去重与筛选
原始命中总行数(去重前):约240行
去重后服饰实质相关行数:约30行
归纳为独立条目:22条
剔除主要类别:
- "锦衣卫"相关:约30处,均为军事机构语境,非服饰
- "印"相关:约20处,均为官印语境
- "服"的非服饰用法:约15处(服阕、降服、服劳、服食等)
- "章"的非服饰用法:约30处(章纶、文章、条章等)
- "领"的非服饰用法:约10处(领兵、领职等)
- "带"的非服饰用法:约10处(带俸、地带等)
四、对抗式学术审查
审查1:误收风险
- 第464条"衣冠重整凤凰城""袈裟新换龙袍"为传说建文帝诗,文学性强,已标注"意象"类别
- 第588条"披毡衣"为隐者服饰,非制度性信息,已收入逸事类
审查2:漏收风险
- 第8-10轮关键词零命中,确认不存在漏收
- 第3轮"褐"字零命中("褐"仅在排除项中未出现)
- 补充搜索"袭衣""蟒衣"确认无遗漏
审查3:时代混淆
- 第820条"黄衣""衣紫"为追述唐代制度,已明确标注
- 第197条"勿加冕服"为洪武朝对古帝王塑像的处理,非当朝制度
审查4:机构名vs服饰实质
- 第179条"尚衣监""巾帽局""织染局""针工局"为机构名,本身非服饰描述,但揭示了服饰管理体系,予以保留并标注
审查5:数量数据的可靠性
- 第313条赏瓦剌"织金彩表纻丝二万六千四百三十二,绢九万一百二十七,衣靴帽万"为作者亲历或据档册,数据可信度较高
- 第820条内侍用料数据为工部奏报,来源可靠
五、产出文件清单
| 文件名 |
内容 |
大小限制 |
| 今言_总结.md |
服饰内容分类总结与学术审查 |
≤20KB |
| 今言_日志.md |
本文件:提取过程记录 |
≤20KB |
| 今言_原文提取.md |
服饰相关原文全文 |
≤20KB |
六、技术说明
- 全程使用
rg(ripgrep) + sed 提取,未加载整本TXT
- 每轮搜索结果通过
head -200 限制输出
- 最终提取使用
sed -n '行号p' 精准定位
- 所有文件UTF-8编码,Markdown格式