《两汉博闻》服饰提取日志
任务信息
- 输入文件:
/home/z/my-project/upload/11111/part1/两汉博闻.txt - 文件大小: 278,673 字节(约272KB)
- 文件编码: UTF-8
- 总行数: 3886行
- 输出目录:
/home/z/my-project/upload/11output/两汉博闻/
提取方法
严格使用grep逐轮匹配关键词,未加载全文。
10轮关键词匹配日志
第1轮:衣/裳/服/冠/冕/弁/袍/裘
- 匹配行数: 约70行
- 伪阳性: "服虔"出现约25次(人名,东汉经学家),全部排除
- 有效服饰行: 约45行
- 关键发现: 襃衣博带、竹皮冠、弋绨、鹖冠、鵔鸃冠、元服、羽衣、绣衣直指、三服官、珠襦、犊鼻裈、五时衣、画衣冠异章服、舆服志条目
第2轮:巾/帽/帻/幞头/簪/缨
- 匹配行数: 约22行
- 伪阳性: "缗丝"(货币)、"丝"作人名(爰盎字丝)
- 有效服饰行: 约16行
- 关键发现: 绿帻傅韝、苍头青帻、折角巾/林宗巾、幅巾、帻、绡头/幧头、玉簪搔头、黄巾、赤帻、黄帽
第3轮:帛/绢/绫/罗/绸/缎/锦/绮/丝/麻/葛/褐
- 匹配行数: 约40行
- 伪阳性: "绮里季"(人名)、"胶葛"(非织物)、"子丝"(人名)、"竹帛"(文献载体)、"缣帛图书"(文献)、"绮疏"(建筑装饰)
- 有效服饰行: 约18行
- 关键发现: 绮今细绫/纨素、弋绨厚缯、锦绮纨素、青缣白绫被、火浣布、罽织毛为布、暴室织作染练
第4轮:佩/笏/带/绶/鱼袋/玺/印
- 匹配行数: 约55行
- 伪阳性: "带河阻山"(地理)、"佩刀"(武器)、大量"印"为行政用印非服饰、"印刎"(政治行为)、"印章"多数非服饰
- 有效服饰行: 约25行
- 关键发现: 金印赤韨縌、金玺盭绶、六玺紫泥、缙绅搢笏、银珰貂饰、绣衣直指、韦带、黄绶、紫艾绶、传国玺
第5轮:履/舄/鞋/靴/袜
- 匹配行数: 约10行
- 伪阳性: "足履龟文"(相术)
- 有效服饰行: 约8行
- 关键发现: 躧履、脱屣、蹻/草履、衣敝履空、正履
第6轮:舆服/服色/赐服/章服/冠服/品服/朝服/公服/祭服/丧服
- 匹配行数: 约8行
- 伪阳性: 无明显伪阳性
- 有效服饰行: 约8行
- 关键发现: 舆服志系列条目、画衣冠异章服、朝服、冠冕衣服法五行色
第7轮:绣/纹/黼/黻/章/染/织
- 匹配行数: 约60行
- 伪阳性: 大量"章"为章节/章奏/章邯(人名)/章城门,"织"极少单独出现,"绣"多为人名或绣衣直指已计
- 有效服饰行: 约5行(去重后新增2行)
- 关键发现: 暴室织作染练之署、缋绣、罽织毛为布
第8轮:裙/衫/袄/褐/帔/褙子/深衣/襕衫
- 匹配行数: 约5行
- 伪阳性: 无
- 有效服饰行: 约5行(均为已收录条目)
- 关键发现: 裋褐、衽褐(均已收录)
第9轮:进贤冠/武冠/貂蝉/笼巾/额子
- 匹配行数: 约2行
- 伪阳性: 无
- 有效服饰行: 约2行(均已收录)
- 关键发现: 进贤冠、武冠/鹖冠(确认关联)
第10轮:衮/襦/裆/裈/袴/褶/裾/袂/衿/衽/领/袖/襟
- 匹配行数: 约25行
- 伪阳性: "喉咽襟要"(比喻)、"山领"(地理)、"封牛领"(动物)、"总领纲纪"(动词)
- 有效服饰行: 约12行
- 关键发现: 绮襦纨袴、犊鼻裈、珠襦、襃大裾、方领、广领大袖、攘袂、衽褐、衿带、要领
去重与审校
伪阳性排除统计
| 类型 | 出现次数 | 处理方式 |
|---|---|---|
| "服虔"(人名) | ~25次 | 全部排除 |
| "章"非章服义 | ~40次 | 逐一判读排除 |
| "带"非衣带义 | ~8次 | 排除地理/动词用法 |
| "印"非服饰 | ~15次 | 仅保留印绶组合 |
| "领"非衣领义 | ~5次 | 排地理/动词用法 |
| 其他 | ~10次 | 逐条判读 |
有效条目合并
10轮提取共获原始匹配行约295行,经去伪、去重、合并后,确认服饰直接相关条目约90条。
对抗式学术审查
审查问题1:是否存在将非服饰条目误判为服饰的风险?
结论:存在,已尽量修正。
- "冠盖相望""沐猴而冠"为成语,非服饰制度,但保留于"其他相关"类并标注为成语用例
- "带厉"为封爵誓辞比喻,保留但标注"非衣带实物"
- "要领"为比喻用法,保留但标注语义来源
审查问题2:是否存在遗漏?
可能遗漏:
- "黼""黻"单独出现时可能被第7轮遗漏(因匹配"章"字时大量伪阳性干扰),但经复查本书中此二字确实未独立出现
- "深衣""裙""褙子""襕衫"等宋代常见服饰名在本书中未检出,符合两汉文献特征
- "舄""靴""袜"未检出,可能本书确实未涉及此类内容
审查问题3:注释归属是否准确?
- 前汉书部分注释均为颜师古注,后汉书部分为章怀太子(李贤)注
- "注云"开头的条目来自后汉书李贤注
- 个别"服虔曰""应劭曰"为汉晋旧注经颜师古转录
审查问题4:本书服饰信息是否有独立史料价值?
有限。本书本质是类书摘编,所有信息均源自前后汉书原文及颜注/李贤注,无新增一手史料。其价值在于:
- 某些注释在通行版本中已佚(如四皓条下颜注),本书幸存
- 三服官、法冠等条目的注释聚合了多家说法,便于比较
文件大小验证
| 文件名 | 大小 | 是否≤20KB |
|---|---|---|
| 两汉博闻_原文提取.md | 14,525 字节 | ✅ |
| 两汉博闻_总结.md | 4,338 字节 | ✅ |
| 两汉博闻_日志.md | 本文件 | ✅ |
| 合计 | 24,492 字节 | — |
全部文件均满足≤20KB限制。