《使辽语录》服饰提取工作日志
基本信息记录
| 项目 | 内容 |
|---|---|
| 输入文件 | /home/z/my-project/upload/11111/part1/使辽语录.txt |
| 文件大小 | 17,196 字节 |
| 文件行数 | 145 行 |
| 输出目录 | /home/z/my-project/upload/11output/使辽语录/ |
| 提取方法 | rg (ripgrep) + sed 逐行提取,严禁加载全文 |
| 审查方法 | 对抗式学术审查 |
10轮关键词提取详录
Round 1:衣/裳/服/冠/冕/弁/袍/裘
| 行号 | 匹配词 | 上下文 | 审查结论 |
|---|---|---|---|
| 8 | 裳(公裳) | 臣等依例,即时具公裳 | ✅ 有效——使臣正式官服 |
| 78 | 衣(衣带) | 赐臣等衣带 | ✅ 有效——辽帝赐衣带 |
| 88 | 衣(衣币) | 赐臣等弓马、衣币 | ✅ 有效——辽方赐衣币 |
| 90 | 衣(赐衣/衣币) | 赐衣各三对,及弓马、衣币 | ✅ 有效——辞行赐衣 |
本轮有效:4条
Round 2:巾/帽/帻/幞头/簪/缨
匹配结果:0条
无任何匹配。本文不含冠帽、首服类信息。
Round 3:帛/绢/绫/罗/绸/缎/锦/绮/丝/麻/葛/褐
| 行号 | 匹配词 | 上下文 | 审查结论 |
|---|---|---|---|
| 6 | 绢 | 送三司人茶、绢、银楪子等 | ✅ 有效——宋方赠辽方绢 |
| 134 | 绢、绫、罗 | 折绢、绫、罗等 | ✅ 有效——留府折赐丝织品 |
本轮有效:2条
Round 4:佩/笏/带/绶/鱼袋/玺/印
| 行号 | 匹配词 | 上下文 | 审查结论 |
|---|---|---|---|
| 78 | 带(衣带) | 赐臣等衣带 | ✅ 有效——与Round 1重复发现 |
本轮有效:1条(与R1重复)
Round 5:履/舄/鞋/靴/袜
| 行号 | 匹配词 | 上下文 | 审查结论 |
|---|---|---|---|
| 24 | 履(跤履) | 问臣等道途跤履不易 | ❌ 伪阳性——跤履=跋涉,非鞋履 |
本轮有效:0条
Round 6:舆服/服色/赐服/章服/冠服/品服/朝服/公服/祭服/丧服
匹配结果:0条
本文不含服制术语。
Round 7:绣/纹/黼/黻/章/染/织
| 行号 | 匹配词 | 上下文 | 审查结论 |
|---|---|---|---|
| 134 | 章(马世章) | 閤门祗候马世章 | ❌ 伪阳性——人名用字,非章服 |
本轮有效:0条
Round 8:裙/衫/袄/褐/帔/褙子/深衣/襕衫
匹配结果:0条
本文不涉及下装或日常便服。
Round 9:进贤冠/武冠/貂蝉/笼巾/额子
匹配结果:0条
本文不含首服名目。
Round 10:衮/襦/裆/裈/袴/褶/裾/袂/衿/衽/领/袖/襟
匹配结果:0条
本文不含衣片部件术语。
对抗式学术审查记录
审查1:跤履(L24)
| 项目 | 内容 |
|---|---|
| 原始匹配 | Round 5,关键词"履" |
| 原文 | 问臣等道途跤履不易 |
| 争议点 | "履"是否指鞋履? |
| 考证 | "跤履"为古文固定表达,义同"跋涉""行路",履为比喻用法,代指行走行为而非具体鞋履。此为辽方官员寒暄语,询问宋使旅途辛劳。 |
| 结论 | 伪阳性,排除 |
审查2:马世章(L134)
| 项目 | 内容 |
|---|---|
| 原始匹配 | Round 7,关键词"章" |
| 原文 | 閤门祗候马世章赐臣等筵 |
| 争议点 | "章"是否指章服/章纹? |
| 考证 | "马世章"为完整人名,辽方官员姓名。此"章"为名字用字,与服饰制度中的"章服""章纹"概念无关。 |
| 结论 | 伪阳性,排除 |
审查3:衣币中的"币"是否属服饰?
| 项目 | 内容 |
|---|---|
| 争议点 | "衣币"中"币"是否应纳入服饰范畴? |
| 考证 | 古汉语"币"本指缯帛(《说文》:"币,帛也"),后泛指礼品。在宋代外交语境中,"衣币"为固定词组,指衣料与丝帛类赠礼。"币"虽有货币义,但在"衣币"组合中仍偏丝帛义,与衣同属织物范畴。 |
| 结论 | 保留,纳入丝织品类别 |
审查4:公裳是否为泛称而非具体服饰?
| 项目 | 内容 |
|---|---|
| 争议点 | "公裳"仅为礼仪程序提及,无具体形制描述,是否算有效服饰信息? |
| 考证 | 公裳虽为泛称,但明确指涉使臣正式着装,属服饰制度范畴。即使无细节描述,其存在本身即表明宋代使臣有出使服制规范,具有制度史价值。 |
| 结论 | 保留,但标注信息粒度有限 |
提取统计汇总
| 指标 | 数值 |
|---|---|
| 10轮grep总命中行数 | 8行 |
| 去重后唯一行数 | 6行 |
| 伪阳性排除 | 2行(L24跤履、L134马世章) |
| 最终有效条目 | 6条 |
| 服饰内容密度 | 4.1%(6/145行) |
| 零匹配轮次 | 6轮(R2、R5有效、R6、R7、R8、R9、R10) |
产出文件清单
| 文件名 | 内容 | 预估大小 |
|---|---|---|
| 使辽语录_原文提取.md | 原文摘录+审查标注 | ~4KB |
| 使辽语录_总结.md | 学术总结+评价 | ~5KB |
| 使辽语录_日志.md | 本文件,工作日志 | ~4KB |
方法论反思
- grep+sed方法的有效性:对于本文这类短文本(145行),关键词grep覆盖率高,但单字匹配容易产生伪阳性(如"跤履""马世章"),必须配合语境审查。
- 10轮关键词的覆盖度:所给10轮关键词涵盖面广,但本文服饰信息集中于赐礼泛称(衣、衣带、衣币),这类信息靠R1(衣/裳/服)即可捕获。R6-R10的精细术语在本文中完全无用武之地,反证本文服饰信息的粗疏性。
- 禁载全文的执行:全程使用rg+sed提取特定行,未使用Read工具读取全文,严格遵守规则。