研究总结 日志 原文

《情史》服饰提取日志

任务信息

检索过程

第1轮:核心服饰词检索

检索命令

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|...' 情史.txt

命中行数:1435行(去重后)

命中密度分析

高价值关键词命中统计

关键词 命中行数 有效比例 说明
较多 多为服饰语境
较多 多为服饰语境
中等 多为服饰语境
较多 几乎均为首饰
中等 几乎均为首饰
较少 极高 均为首饰
中等 部分为人名/动词
极多 "带领""地带"等非服饰义多
较多 "冠军""冠绝"等非服饰义多
极多 "服从""服药""服丧"等多义
极多 "衣"作动词保留,成语视语境

第2轮:制度动作词检索

检索命令

rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' 情史.txt

命中行数:8行

逐条审查

  1. 第1273行:敛衽(李姝庄色敛衽)——保留,服饰礼仪动作
  2. 第1350行:敛衽(张氏敛衽曰)——保留,服饰礼仪动作
  3. 第1840行:僭(天道亦僭赏矣)——排除,非僭越服饰制度
  4. 第3612行:僭(明玉珍僭号于蜀)——排除,僭号非僭服
  5. 第3812行:赐紫(赐紫茸云气帐)——保留,赐紫为制度词
  6. 第4410行:敛衽(素妆女子敛衽而起)——保留,服饰礼仪动作
  7. 第5080行:敛衽(始敛衽颦蹙曰)——保留,服饰礼仪动作
  8. 第5612行:敛衽(春娘敛衽而前曰)——保留,服饰礼仪动作
  9. 第5811行:敛衽(罔敛衽敬羡)——保留,服饰礼仪动作
  10. 第6205行:敛衽(见君莫不敛衽而拜)——保留,服饰礼仪动作
  11. 第6482行:敛衽(正色敛衽不对)——保留,服饰礼仪动作
  12. 第6550行:加冠(加冠礼初成)——保留,冠礼制度词
  13. 第7271行:赐绯(赐绯骰子)——保留,赐绯制度

有效命中:8条(敛衽6处、赐紫1处、加冠1处、赐绯1处)

第3轮:组合扩展词检索

重点搜索

rg -n '蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛|布|纱|丹|钿|笄|帔|璎珞|云肩|霞帔' 情史.txt

关键新增命中

审查汇总

轮次 命中行数 估计有效条目 主要排除原因
第1轮 1435 ~120 多义字(带=带领、冠=冠军、服=服从)
第2轮 8+ 8 僭=僭号非僭服
第3轮 200+ ~20 布=布政司、著=著书、丹=丹药
合计 1600+ ~150 综合误命率约90%

误命率分析

大文本处理策略

鉴于《情史》篇幅大(7307行)、命中多(1435行),采用以下策略:

  1. 第1轮仅统计命中行数,不逐条审查
  2. 优先审查高价值关键词(裙、衫、袍、钗、簪、钏、步摇、花钿、霞帔等)
  3. 制度动作词逐条审查
  4. 依类别而非行号整理输出

结论

《情史》服饰内容极为丰富,是本次批次信息量最大的书目。以宫廷服饰、女性首饰、闺阁服饰为三大核心板块,兼具礼服制度、赐服制度等政治服饰信息。