研究总结 日志 原文

《皇清秘史》服饰提取日志

基本信息


提取流程

第1轮:基础服饰词(衣、裳、袍、褂、裙)

关键词衣[衫裤带襟袍褂裾袖领]|裳|袍[子下]?|褂[子]?|裙[子下边]?

命中行数:80+行(截取前80行)

有效发现

第2轮:冠帽鞋履词(冠、帽、靴、鞋、履)

关键词冠[带帽子]?|帽[子儿]?|靴[子儿]?|鞋[子儿底]?|朱履|朝珠|花翎

命中行数:80+行

有效发现

第3轮:配饰珠玉词(佩、珠、玉、簪、钗)

关键词佩[饰玉戴刀]?|珠[翠宝钗饰冠]?|玉[带佩簪钗环坠]?|簪[子花]?|钗[头钿环]?|朝珠|珊瑚|翡翠|碧玉|金镯|玉镯

命中行数:80+行

有效发现

第4轮:面料颜色词(缎、绸、纱、锦、绣)

关键词缎|绸|纱|锦[绣旗袍衣]?|绣[花衣球帮儿]?|蟒[袍衣]?|龙[袍衣]?|朝[服衣冠]|吉服|补服|黄马褂

命中行数:80+行

有效发现

第5轮:宫廷礼服词(朝服、龙袍、蟒袍、补服、吉服)

关键词朝服|龙袍|蟒袍|补服|吉服|黄马褂|凤冠|霞帔|蟒缎|顶戴|花翎|翎子|顶子

命中行数:37行

有效发现

第6轮:妆饰仪态词(妆、髻、钿、翠、凤冠)

关键词妆[饰容]?|髻|钿|翠|凤冠|胭脂|脂粉|云鬟|鬓[发角影]|蛾眉|淡装|素服|艳服|旗装|满装

命中行数:80+行

有效发现


审查过滤

剔除的无效命中

  1. 非服饰用法的"衣""冠"

    • "衣冠"用作代称(如"衣冠禽兽"意)——保留为文化语境
    • "霓裳"为回目修辞——保留(第130回回目)
    • "玉食万方"中"玉"为饮食修饰——剔除
  2. 武器/法器

    • "血滴子,是一顶铁打成的帽子"(L852)——虽称帽子,实为暗器,剔除
    • "佩刀"——属武器,非服饰,剔除
  3. 泛泛提及无描写价值

    • "穿衣"作为日常行为提及(多处)
    • "宽衣"作为动作描写
    • "衣袖""衣襟"作为身体部位代称

保留但标注的边缘条目


提取结果统计

指标 数值
总grep轮次 6
总命中行数(去重前) ~437
去重后有效行数 ~65
有描写价值的条目 40
含详细服饰描写的段落 8
输出文件 3