研究总结 日志 原文

《照世杯》服饰提取日志

基本信息

提取流程

第1轮:上衣类关键词

关键词:衣|裳|衫|袍|褂|裘|袄|褐|鹤氅|披风|斗篷|褡|裰|褶|裥|领|襟|袖|衿

命中:18处(去重后有效服饰条目)

过滤:排除"衣服"泛称(无具体款式信息者)5处,保留有服饰价值的13处。

第2轮:下衣及裙类

关键词:裙|裈|裆|绔|袴

命中:6处

过滤:"裙钗"为女性代称非实写服饰,标注但不计入实物条目。

第3轮:首服及鞋履

关键词:帽|冠|巾|履|鞋|靴|毡

命中:12处

过滤:帽子泛称(如"抢帽子")不计入具体款式,但"烟墩帽上钉明珠"因有装饰细节而保留。

第4轮:饰品类

关键词:簪|钗|环|珰|钏|钿|坠|佩|梳|篦|帕|带

命中:15处

过滤:"玉马"虽为饰物挂件,但在卷三中更接近信物/宝物功能,双归类。汗巾兼具实用品与传情道具功能。

第5轮:面料及织物

关键词:绢|罗|纱|绸|缎|锦|绣|绒|绮|貂|狐|布

命中:14处

过滤:"锦心绣口"为成语比喻,非服饰;"红缎扎龙门"为装饰非服饰用缎,但记录在案。

第6轮:综合及特殊服饰

关键词:妆|脂|粉|艳|浓|翠|珠|翠袖|红鞋|朱履|方巾|湘裙|布衣|粗服|儒巾|花脸|簇新|破巾|破服|金钗|鲜红|红缎|红毡|珠帘

命中:22处(与前5轮有重叠)

过滤:珠帘为建筑帘幕非服饰;鲜红用于图印非服饰。

对抗式审查

审查1:伪服饰条目剔除

原始条目 判定 理由
锦心绣口 ❌剔除 成语比喻,非实写服饰
珠帘 ❌剔除 建筑帘幕
红缎扎龙门 ⚠️保留备注 非服饰用缎,但反映缎料用途
裙钗 ⚠️标注 女性代称,非实写裙与钗
鲜红小图印 ❌剔除 印章非服饰
衣服(泛称) ❌剔除5处 无具体款式信息
帽子(泛称"抢帽子") ⚠️标注 动作道具,非款式描写

审查2:遗漏风险检查

审查3:分类合理性

最终统计

指标 数值
6轮grep原始命中 101处
去重后有效命中 约55处
伪服饰剔除 8处
最终有效服饰条目 39条
涉及篇卷 4/4(全覆盖)
服饰类别 7类