研究总结 日志 原文

《使辽语录》服饰提取工作日志


基本信息记录

项目 内容
输入文件 /home/z/my-project/upload/11111/part1/使辽语录.txt
文件大小 17,196 字节
文件行数 145 行
输出目录 /home/z/my-project/upload/11output/使辽语录/
提取方法 rg (ripgrep) + sed 逐行提取,严禁加载全文
审查方法 对抗式学术审查

10轮关键词提取详录

Round 1:衣/裳/服/冠/冕/弁/袍/裘

行号 匹配词 上下文 审查结论
8 裳(公裳) 臣等依例,即时具公裳 ✅ 有效——使臣正式官服
78 衣(衣带) 赐臣等衣带 ✅ 有效——辽帝赐衣带
88 衣(衣币) 赐臣等弓马、衣币 ✅ 有效——辽方赐衣币
90 衣(赐衣/衣币) 赐衣各三对,及弓马、衣币 ✅ 有效——辞行赐衣

本轮有效:4条

Round 2:巾/帽/帻/幞头/簪/缨

匹配结果:0条

无任何匹配。本文不含冠帽、首服类信息。

Round 3:帛/绢/绫/罗/绸/缎/锦/绮/丝/麻/葛/褐

行号 匹配词 上下文 审查结论
6 送三司人茶、绢、银楪子等 ✅ 有效——宋方赠辽方绢
134 绢、绫、罗 折绢、绫、罗等 ✅ 有效——留府折赐丝织品

本轮有效:2条

Round 4:佩/笏/带/绶/鱼袋/玺/印

行号 匹配词 上下文 审查结论
78 带(衣带) 赐臣等衣带 ✅ 有效——与Round 1重复发现

本轮有效:1条(与R1重复)

Round 5:履/舄/鞋/靴/袜

行号 匹配词 上下文 审查结论
24 履(跤履) 问臣等道途跤履不易 ❌ 伪阳性——跤履=跋涉,非鞋履

本轮有效:0条

Round 6:舆服/服色/赐服/章服/冠服/品服/朝服/公服/祭服/丧服

匹配结果:0条

本文不含服制术语。

Round 7:绣/纹/黼/黻/章/染/织

行号 匹配词 上下文 审查结论
134 章(马世章) 閤门祗候马世章 ❌ 伪阳性——人名用字,非章服

本轮有效:0条

Round 8:裙/衫/袄/褐/帔/褙子/深衣/襕衫

匹配结果:0条

本文不涉及下装或日常便服。

Round 9:进贤冠/武冠/貂蝉/笼巾/额子

匹配结果:0条

本文不含首服名目。

Round 10:衮/襦/裆/裈/袴/褶/裾/袂/衿/衽/领/袖/襟

匹配结果:0条

本文不含衣片部件术语。


对抗式学术审查记录

审查1:跤履(L24)

项目 内容
原始匹配 Round 5,关键词"履"
原文 问臣等道途跤履不易
争议点 "履"是否指鞋履?
考证 "跤履"为古文固定表达,义同"跋涉""行路",履为比喻用法,代指行走行为而非具体鞋履。此为辽方官员寒暄语,询问宋使旅途辛劳。
结论 伪阳性,排除

审查2:马世章(L134)

项目 内容
原始匹配 Round 7,关键词"章"
原文 閤门祗候马世章赐臣等筵
争议点 "章"是否指章服/章纹?
考证 "马世章"为完整人名,辽方官员姓名。此"章"为名字用字,与服饰制度中的"章服""章纹"概念无关。
结论 伪阳性,排除

审查3:衣币中的"币"是否属服饰?

项目 内容
争议点 "衣币"中"币"是否应纳入服饰范畴?
考证 古汉语"币"本指缯帛(《说文》:"币,帛也"),后泛指礼品。在宋代外交语境中,"衣币"为固定词组,指衣料与丝帛类赠礼。"币"虽有货币义,但在"衣币"组合中仍偏丝帛义,与衣同属织物范畴。
结论 保留,纳入丝织品类别

审查4:公裳是否为泛称而非具体服饰?

项目 内容
争议点 "公裳"仅为礼仪程序提及,无具体形制描述,是否算有效服饰信息?
考证 公裳虽为泛称,但明确指涉使臣正式着装,属服饰制度范畴。即使无细节描述,其存在本身即表明宋代使臣有出使服制规范,具有制度史价值。
结论 保留,但标注信息粒度有限

提取统计汇总

指标 数值
10轮grep总命中行数 8行
去重后唯一行数 6行
伪阳性排除 2行(L24跤履、L134马世章)
最终有效条目 6条
服饰内容密度 4.1%(6/145行)
零匹配轮次 6轮(R2、R5有效、R6、R7、R8、R9、R10)

产出文件清单

文件名 内容 预估大小
使辽语录_原文提取.md 原文摘录+审查标注 ~4KB
使辽语录_总结.md 学术总结+评价 ~5KB
使辽语录_日志.md 本文件,工作日志 ~4KB

方法论反思

  1. grep+sed方法的有效性:对于本文这类短文本(145行),关键词grep覆盖率高,但单字匹配容易产生伪阳性(如"跤履""马世章"),必须配合语境审查。
  2. 10轮关键词的覆盖度:所给10轮关键词涵盖面广,但本文服饰信息集中于赐礼泛称(衣、衣带、衣币),这类信息靠R1(衣/裳/服)即可捕获。R6-R10的精细术语在本文中完全无用武之地,反证本文服饰信息的粗疏性。
  3. 禁载全文的执行:全程使用rg+sed提取特定行,未使用Read工具读取全文,严格遵守规则。