研究总结 日志 原文

《画图缘》服饰提取日志

提取时间:2026-03-04
输入文件:/home/z/my-project/upload/part3/画图缘.txt(311,663字节,693行)
输出目录:/home/z/my-project/upload/3小说output/画图缘/


一、提取流程

第1轮grep:基本衣类词

关键词:衣、裳、袍、衫、裙、裤
命中行数:约25行
有效提取

过滤:排除"衣食"(行35等,指生计)、"衣巾"作"衣冠"泛称但非服饰描写者保留。

第2轮grep:冠帽首饰词

关键词:冠、帽、巾、簪、钗、环、珮、佩
命中行数:约30行
有效提取

过滤:排除"冠玉"(行50,比喻容貌)、"环"作"环绕"义者。

第3轮grep:布帛织料词

关键词:绫、罗、绸、缎、锦、绣、纱、绢、缯、帛
命中行数:约15行
有效提取

过滤:排除"绣阁"(泛指闺房)、"锦绣"作形容词非指实物者。

第4轮grep:珠宝金银词

关键词:玉、珠、翠、金、银、珰、钏、镯、钿
命中行数:约50行(大量"金"字作金钱/金瓯义)
有效提取

过滤:排除"金瓯"(行33/36,国家喻)、"金钱"(行35,军费)、"金银"(行121,劫掠财物)、"玉蕴辉山"(行92,比喻)等非服饰用法。

第5轮grep:鞋履带袜词

关键词:襦、袄、褐、裘、带、履、靴、屐、屦、袜、鞋
命中行数:约12行
有效提取

过滤:排除"地带"(地理)、"履"作"履历/践行"义者。

第6轮grep:妆扮颜色词

关键词:妆、脂、粉、髻、鬟、黛、钿、红、紫、青、蓝
命中行数:约40行("红""青"出现频率极高)
有效提取

过滤:大量排除"红"作"红尘/红毡/红丝"等非衣饰义、"青"作"青年/青羊岭"等、"蓝玉"为人名。


二、审查与取舍

保留标准

  1. 直接描写人物穿着的实物服饰
  2. 与服饰相关的礼仪用品(聘物、催妆物)
  3. 服饰作为身份/地位标识的语境

排除标准

  1. 比喻用法(美如冠玉、玉蕴辉山)
  2. 泛指非实物(锦绣作形容词)
  3. 金钱/财物语境(金银、金瓯)
  4. 地名/人名中的颜色词(青羊岭、蓝玉)
  5. 建筑陈设(纱窗、红毡铺地)

最终收录

经6轮搜索+过滤,共收录38条服饰相关原文,分为5类:


三、数据统计

指标 数值
原文总行数 693
原文总字节 311,663
grep搜索轮次 6
grep总命中行数 约172行(含大量非服饰义)
过滤后有效行数 约38条
服饰描写密度 约1条/18行(低密度)

四、注意事项

  1. 本书为清初作品,服饰制度以明代为底本(儒巾蓝衫、乌纱帽等),部分描写有清代痕迹。
  2. "碧玉连环"虽属首饰,但其在书中功能为聘礼信物,兼具服饰与礼仪双重属性。
  3. 女性角色(蓝玉小姐、赵红瑞)的服饰几乎无日常描写,仅在婚礼场景有盛装提及,反映才子佳人小说"重才轻貌"的倾向。
  4. "片玉巾"为作者自造词,未见于明代服饰制度,或为小说家虚构。

日志完毕。