研究总结 日志 原文

《家范》服饰内容提取操作日志

基本信息

操作步骤记录

步骤1:查看文件总行数

wc -l 家范.txt → 675行

步骤2:第一轮搜索——核心服饰词

关键词:衣、裳、裘、冠、冕、弁、帻、帽、巾、履、舄、鞋、靴、袜、带、绶、佩、笏、袍、衫、裙、袴、褐、衮、褶、裲裆、半臂、帔、蓑

匹配行号:47, 57, 69, 71, 82, 84, 89, 96, 151, 176, 193, 195, 208, 219, 225, 229, 235, 237, 239, 241, 243, 249, 252, 270, 301, 303, 307, 313, 320, 321, 322, 332, 339, 355, 357, 359, 367, 380, 384, 406, 425, 427, 431, 432, 434, 443, 484, 487, 492, 494, 496, 499, 502, 503, 510, 523, 557, 569, 577, 579, 581, 582, 592, 594, 639, 655, 657, 659, 668

命中行数: 约68行(含大量"衣""带""冠"等高频字泛匹配)

步骤3:第二轮搜索——材质织物词

关键词:锦、绮、绫、罗、缎、绢、帛、丝、绸、纱、缟、纨、絺、绤、葛、麻、布、褐、裘、毡、罽

匹配行号:63, 66, 72, 76, 84, 89, 90, 102, 121, 171, 174, 303, 328, 355, 357, 427, 429, 474, 488, 499, 502, 503, 522, 523, 542, 547, 557, 577, 579, 581, 582, 589, 610, 618, 639, 655

命中行数: 约36行

步骤4:第三轮搜索——服色纹饰词

关键词:紫、绯、绿、青、朱、赭、玄、黄、黼、黻、文章、龙纹、凤纹、补子

匹配行号:22, 114, 138, 158, 174, 187, 301, 317, 455, 476, 478, 484, 536, 547, 559, 591, 625, 659

命中行数: 约18行(多数为姓名、地名中的"朱""黄""玄"等非服饰用字)

去噪后有效行:659(绿衣黄裳)、591(织玄紞)

步骤5:第四轮搜索——首饰配饰词

关键词:簪、钗、步摇、钿、珥、环、钏、镯、璎珞、带钩、鱼袋、香囊、扇

匹配行号:229, 434, 523, 559, 596

命中行数: 5行

步骤6:第五轮搜索——动作制度词

关键词:赐服、赐紫、赐绯、借紫、借绯、冠礼、加元服、释服、丧服、吉服、朝服、公服、常服、便服、祭服、戎服、法服

匹配行号:57(朝服)、172/555(常服大练)、217(朝服)、592(祭服、朝衣)

命中行数: 5行

步骤7:第六轮搜索——补充词

关键词:梳妆、脂粉、妆、首饰、珠翠、翠翘、花钿、抹胸、肚兜、缠足、裹脚、绣、裁、缝、织、纴、纺、缫、染、浣、洗、衣冠、冠带、儒服、道服、僧服、布衣

匹配行号:57, 63, 72, 84, 104, 151, 171, 172, 239, 355, 357, 365, 380, 384, 427, 432, 494, 502, 503, 510, 536, 555, 557, 577, 579, 582, 591, 606, 610, 643

命中行数: 约30行

步骤8:去重去噪处理

去噪规则:

  1. "朱""黄""玄"等出现在人名地名中者删除(如"朱晖""朱氏""黄门""玄成")
  2. "丝发"为比喻义("不以丝发间指"),非服饰实指,删除
  3. "文章"出现在"妄刊文章"语境中,指文辞,非纹饰,删除
  4. "衣"在"衣不解带"中为固定语式,保留但标注为修辞
  5. "布衣"在"布衣昆弟"中喻微贱时交情,非服饰实指,但保留标注隐喻义

去重结果: 六轮搜索合并后,有效服饰片段约50处,去重后独立条目约45条。

步骤9:上下文提取

对关键行号执行 sed -n '起始行,结束行p',前后各扩展5行,确认语境。重点提取了以下区段:

步骤10:分类整理

将有效片段分为六大类:

步骤11:对抗式学术审查

步骤12:产出三份MD文档

统计数据

指标 数值
文件总行数 675
六轮搜索总匹配行数 约162行(含重复)
去重后有效服饰片段 约50处
去噪后独立条目 约45条
服饰相关行占全书比例 约7.4%
最高频服饰词汇 衣(含衣裳、衣服、衣不解带等)
最具研究价值片段 "绿衣黄裳"(行659)、义保换衣(行668)