《郎潜纪闻二笔》服饰提取操作日志
基本信息
- 书名:《郎潜纪闻二笔》
- 作者:清·陈康祺
- 文件路径:/home/z/my-project/upload/part4/郎潜纪闻二笔.txt
- 文件编码:UTF-8
- 文件大小:423,980 字节 / 142,273 字符
- 总行数:1,370 行
操作步骤
步骤1:文件探查
- 命令:
wc -l查看总行数 → 1,370行 - 命令:
file检查编码 → UTF-8 text - 编码验证:Python decode UTF-8 成功,无异常
步骤2:关键词检索
使用Python逐行检索,关键词列表共72个: 衣、裳、冠、冕、袍、裘、带、佩、巾、帻、履、舄、笏、绶、幞头、裙、衫、袄、褐、绅、绫、罗、锦、绣、帛、绢、绸、缎、丝、棉、葛、麻、毡、帽、靴、鞋、袜、褂、领、袖、袂、裾、襟、衽、裤、襦、襕、霞帔、簪、钗、钏、环、珮、鱼袋、服色、朝服、公服、常服、丧服、祭服、戎服、赐服、赐紫、赐绯、蟒衣、飞鱼、补服、乌纱、金带、玉带、革带
命中行数:198行
关键词命中频次统计(前15):
关键词 命中数 服饰用 非服饰用 衣 47 18 29 冠 34 8 26 罗 32 0 32 领 25 1 24 裘 17 7 10 带 15 4 11 环 14 1 13 丝 11 2 9 锦 11 4 7 佩 10 2 8 履 10 0 10 葛 9 2 7 绅 8 1 7 袖 7 2 5 袍 7 5 2
步骤3:上下文提取
- 对每条命中行,提取前后各2行上下文
- 共涉及796行上下文行
步骤4:人工甄别
- 逐条审读198条命中记录的完整上下文
- 排除标准:
- "罗"作人名(罗台山、罗有高、罗壮节、罗泽南等)→ 排除
- "罗"作动词(罗致、罗织、罗掘、罗拜、搜罗)→ 排除
- "领"作动词/名词非服饰义(领兵、领班、纲领、领解、领职)→ 排除
- "环"作动词(环立、环击、环跪、环守、环坐)→ 排除
- "履"作动词(践履)或书名(履园丛话)→ 排除
- "丝"作量词/比喻(一丝一粒、乌丝阑、丝纶)→ 排除
- "绅"作名词(绅士、缙绅)非指大带 → 排除
- "佩"作动词(佩三省总督印、深佩)非指佩饰 → 排除
- "衣"作比喻(布衣=平民、衣钵=传承、戎衣=战争)→ 视语境取舍
- "冠"作动词/比喻(冠绝、冠翎)→ 视语境取舍
- "裘"作人名(裘文达、裘恭勤)→ 排除
- "带"作动词(带兵、奏带)→ 排除
- "锦"作人名/地名(钱锦城、锦城)→ 排除
- "襟"作比喻(襟抱、襟情)→ 排除
- "钗"在人名/非服饰语境 → 保留(L371, L1307需审辨)
- "褐"在"释褐"(进士脱褐)→ 保留(具服饰礼仪意义)
步骤5:补充检索
- 对以下术语进行全文补充检索:四团龙补服、四衩衣服、鹅黄佩刀荷囊、貂裘、黄褂、端罩、绨袍、朝珠、孔雀翎、花翎、蓝翎、巴图鲁、顶戴、赐穿、赐袍、蟒袍、蟒服、冠服、补服
- 新增发现:L907(黑狐端罩护副将)、L941(福文襄异数十三服饰详单)、L759(貂裘猞猁狲)
步骤6:分类整理
- 将39条确认条目分为九大类
- 进行对抗式学术审查,标注误收排除说明
步骤7:产出文件
- 郎潜纪闻二笔_总结.md:服饰结构化综述
- 郎潜纪闻二笔_日志.md:完整操作记录(本文件)
- 郎潜纪闻二笔_原文提取.md:带行号原始片段
甄别率统计
- 总命中行数:198
- 确认服饰相关:39条(约19.7%)
- 排除非服饰用:159条(约80.3%)
- 最高误命率关键词:罗(32/32=100%误命)、履(10/10=100%误命)
- 最低误命率关键词:袍(5/7=71.4%有效)、缎(4/4=100%有效)、靴(2/2=100%有效)
注意事项
- 本书中"罗""领""环""履""绅"等字出现频率高但极少作服饰义,后续处理同类古籍应优先排除
- 年羹尧案服饰僭越条款为本书最集中之服饰史料,需全文引录
- 本书服饰信息多散见于人物传记叙事中,非专题论述,需结合语境判读