研究总结 日志 原文

《两粤梦游记》服饰提取日志

提取元数据

项目 内容
源文件 /home/z/my-project/upload/11111/part1/两粤梦游记.txt
文件大小 81,129字节
行数 122行
提取方法 10轮关键词grep,逐条人工审查
输出目录 /home/z/my-project/upload/11output/两粤梦游记/

10轮关键词检索记录

第1轮:衣/裳/服/冠/冕/弁/袍/裘

行号 关键词命中 初判 审查结论
21 衣(衣不解带) 待定 剔除:成语
41 衣(衣絮缊) 有效 保留
95 衣服(为备衣服) 有效 保留(低价值)
113 冠/服/衣(多处) 有效 保留:核心段落
119 服/衣(盛服、衣银甲、儒衣冠) 有效 保留

命中行数:5行 | 有效条目:约8条

第2轮:巾/帽/帻/幞头/簪/缨

行号 关键词命中 初判 审查结论
113 方巾、满帽、幞头、纱帽、华阳巾 有效 保留:核心段落
119 红缨 有效 保留

命中行数:2行 | 有效条目:约7条

第3轮:帛/绢/绫/罗/绸/缎/锦/绮/丝/麻/葛/褐

行号 关键词命中 初判 审查结论
113 丹帛、绛绘 待定 绛绘剔除(室内装饰);丹帛保留
119 锦绮 有效 保留

命中行数:2行 | 有效条目:2条

第4轮:佩/笏/带/绶/鱼袋/玺/印

行号 关键词命中 初判 审查结论
21 带(衣不解带) 待定 剔除:成语
85 印(匿印) 无效 剔除:官印,非服饰
87 印(封印) 无效 剔除:官印
95 带(衣不解带) 待定 剔除:成语
97 带未命中
113 冠带、钑花带、素带、腰刀 有效 保留
119 带(未命中服饰义)

命中行数:6行 | 有效条目:3条

第5轮:履/舄/鞋/靴/袜

行号 关键词命中 初判 审查结论
113 皂靴、履之若绵 待定 皂靴保留;履之若绵剔除(踩踏地面)

命中行数:1行 | 有效条目:1条

第6轮:舆服/服色/赐服/章服/冠服/品服/朝服/公服/祭服/丧服

行号 关键词命中 初判 审查结论
97 公服 有效 保留
113 服色、冠服、公服 有效 保留
121 冠服 有效 保留

命中行数:3行 | 有效条目:5条

第7轮:绣/纹/黼/黻/章/染/织

行号 关键词命中 初判 审查结论
113 金缕洒线、补服纹样 有效 保留
119 绣旆 有效 保留(低价值)

注:本轮"章""织"等字有大量非服饰命中(如"章于天"人名、"织"字未命中),已排除。

命中行数:2行 | 有效条目:2条

第8轮:裙/衫/袄/褐/帔/褙子/深衣/襕衫

行号 关键词命中 初判 审查结论
113 轻衫、盘领衫袍 有效 保留

命中行数:1行 | 有效条目:2条

第9轮:进贤冠/武冠/貂蝉/笼巾/额子

零命中。 全文无此类高阶冠饰词汇。

第10轮:衮/襦/裆/裈/袴/褶/裾/袂/衿/衽/领/袖/襟

行号 关键词命中 初判 审查结论
41 缊(衣絮缊) 有效 保留
113 领(盘领)、袖(袖手) 待定 盘领保留;袖手剔除
106 袖(云袖霞裳) 待定 剔除:文学比喻

命中行数:3行 | 有效条目:1条

汇总统计

轮次 关键词组 命中行数 有效条目
1 衣裳服冠冕弁袍裘 5 8
2 巾帽帻幞头簪缨 2 7
3 帛绢绫罗绸缎锦绮丝麻葛褐 2 2
4 佩笏带绶鱼袋玺印 6 3
5 履舄鞋靴袜 1 1
6 舆服服色赐服章服冠服品服朝服公服祭服丧服 3 5
7 绣纹黼黻章染织 2 2
8 裙衫袄褐帔褙子深衣襕衫 1 2
9 进贤冠武冠貂蝉笼巾额子 0 0
10 衮襦裆裈袴褶裾袂衿衽领袖襟 3 1
合计 25 31→12(审查后)

剔除汇总

剔除类型 数量 典型示例
成语/惯用语 3 衣不解带、袖手之交
文学比喻 2 渔蓑樵笠、云袖霞裳
非服饰语境 3 匿印(官印)、履之若绵(踩踏)、覆以绛绘(室内装饰)
人名/地名误命中 2 章于天(人名含"章")

审查方法论说明

本提取严格遵循以下审查原则:

  1. 语境优先:关键词命中后必须回读上下文判断是否为服饰义
  2. 成语排除:如"衣不解带""袖手旁观"等固定表达不作为服饰证据
  3. 比喻鉴别:文学性比喻(如"云袖霞裳")与实指服饰严格区分
  4. 跨领域排除:官印、室内装饰等非服饰领域的命中予以剔除
  5. 价值分级:保留条目按服饰信息含量分为"极高/高/中/低"四级