研究总结 日志 原文

《京城古迹考》服饰内容提取日志

基本信息

项目 内容
源文件 /home/z/my-project/upload/11111/part1/京城古迹考.txt
文件大小 38,919 字节
总行数 103 行
输出目录 /home/z/my-project/upload/11output/京城古迹考/
提取方法 ripgrep (rg) 逐轮关键词搜索,未加载全文
提取时间 2025年

搜索过程记录

第一轮:衣/裳/服/冠/冕/弁/袍/裘

第二轮:巾/帽/帻/幞头/簪/缨

第三轮:帛/绢/绫/罗/绸/缎/锦/绮/丝/麻/葛/褐

第四轮:佩/笏/带/绶/鱼袋/玺/印

第五轮:履/舄/鞋/靴/袜

第六轮:舆服/服色/赐服/章服/冠服/品服/朝服/公服/祭服/丧服

第七轮:绣/纹/黼/黻/章/染/织

第八轮:裙/衫/袄/褐/帔/褙子/深衣/襕衫

第九轮:进贤冠/武冠/貂蝉/笼巾/额子

第十轮:衮/襦/裆/裈/袴/褶/裾/袂/衿/衽/领/袖/襟


补充搜索

妆饰类(梳/妆/饰)

赐服类(赐冠/赐袍/赐衣/赐服/赐带)


提取统计

统计项 数值
总搜索轮次 10轮 + 2轮补充
总搜索关键词组 72个
总匹配行数(去重前) 约20行
有效服饰条目(去重后) 6处
误报排除数 约10行
零匹配轮次 3轮(第五、六、十轮)

方法论反思

  1. 单字搜索的误报问题:中文单字(如"丝""麻""葛""章")在古迹考据文献中大量出现于非服饰语境,第三、四、七轮误报率显著。后续应优先使用双字及以上的复合词搜索。
  2. 借代词的判断标准:"衣冠""弁兵"等词中的服饰字已转义,需根据上下文判断是否为服饰描述。
  3. 塑像服饰的史料价值边界:本书服饰信息均来自塑像/瓷像/石刻,反映的是造像者对历史人物服饰的认知,不能等同于历史实际穿着。
  4. 古迹考类文献的服饰信息特点:以建筑、碑刻为主,服饰仅作为塑像描述的附属信息出现,缺乏制度性、系统性的服饰记载。