研究总结 日志 原文

国秀集 服饰提取日志

基本信息

处理流程

步骤1:wc统计

步骤2:5轮grep关键词扫描

轮次 关键词类型 命中行数
第1轮 核心词 35
第2轮 材质词 21
第3轮 色彩纹饰 110
第4轮 制度词 6
第5轮 配饰词 5

步骤3-4:精准提取与筛选

使用Python脚本综合精准提取,命中15行。经人工审核全部为有效服饰内容或合理服饰意象。

步骤5-6:分类整理与输出

分为5类:官服与品级标识、胡服与民族服饰、女性服饰、军事服饰、隐逸服饰。