研究总结 日志 原文

《西河记》服饰提取日志

任务信息

项目 内容
任务ID 18-d
古籍名称 西河记
输入文件 /home/z/my-project/upload/part4/西河记.txt
输出目录 /home/z/my-project/upload/44output/西河记/
处理日期 2026-03-04

处理步骤记录

步骤1:文件基本信息

步骤2:多轮grep提取服饰关键词

第1轮:核心词提取

第2轮:制度词提取

第3轮:装饰词提取

第4轮:动作词提取

步骤3:sed提取关键段落上下文

步骤4:分类整理

步骤5:产出3份MD文件

关键发现

  1. 词库补充建议:"缬"(绞缬/扎染工艺)未纳入装饰词词库,但为本文核心服饰术语,建议后续补充。
  2. "帬"字:为"裙"之异体,grep时用"裙"可命中此字需注意。
  3. 服饰密度:全文13行中仅1行涉及服饰,但该行信息量极大,涵盖6个服饰维度。
  4. 佚文特点:辑佚本各条互不连贯,服饰内容无上下文段落可扩展,仅能以单条为单位提取。

统计数据

统计项 数值
文件总行数 13
服饰命中行数 2(第9行正文 + 第10行案语)
核心词命中数 5(蚕、裳、袄、锦、布)
制度词命中数 0
装饰词命中数 0("缬"未在词库中)
动作词命中数 2(着×2)
服饰信息密度 15.4%(2/13行)