研究总结 日志 原文

史记集解三家注索隐正义 — 服饰提取日志

基本信息

项目 内容
书名 史记集解三家注索隐正义
源文件 /home/z/my-project/upload/zhengshi/正史/史记集解三家注索隐正义.txt
输出目录 /home/z/my-project/upload/正史重制output/史记集解三家注索隐正义/
总行数 20,332
处理时间 2026-05-23 04:42:26
处理方式 grep+sed提取,禁止整本载入LLM

处理步骤记录

步骤1:文件统计

步骤2:关键词grep统计

冠帽类

衣裳类

服制类

颜色类

佩饰类

舆服类

织物类

赐服类

制度类

步骤3:行号提取与去重

步骤4:分类筛选

步骤5:撰写三份MD文件

  1. 史记集解三家注索隐正义_总结.md — 服饰内容分析总结
  2. 史记集解三家注索隐正义_日志.md — 本文件,处理过程日志
  3. 史记集解三家注索隐正义_原文提取.md — 按类别提取的服饰原文

步骤6:写入输出目录

数据质量说明

  1. 高频通用词处理:黄(582)、白(533)、青(241)等颜色词在古籍中大量出现于人名、地名、自然描写,非服饰语境占比极高。本提取采用"服饰语境组合词"策略(如"紫衣""朱衣""衣帛""白裘"),过滤非服饰用法。
  2. 冠字歧义:"冠"在《史记》中既可指冠帽,也可指冠礼(行冠礼)、冠军(军功第一),需按上下文甄别。
  3. 织物词歧义:"罗""绮"等字常出现于人名(如"绮里季"),需排除。
  4. 赐服类缺失:史记为汉代著作,赐紫赐绯制度尚未形成,故此类关键词均为0。

关键发现


日志记录完毕。