研究总结 日志 原文

《史记疑问》服饰内容提取——操作日志

一、基本信息

项目 内容
书名 史记疑问
输入文件 /home/z/my-project/upload/zhengshi/正史/史记疑问.txt
输出目录 /home/z/my-project/upload/正史重制output/史记疑问/
文件总行数 422行
操作日期 2026-03-05

二、操作流程

步骤1:文件预处理

步骤2:关键词匹配统计

对词库76个关键词逐一 grep -c 统计,结果如下:

关键词 匹配行数 服饰相关性
7 ✅ 直接相关
1 ✅ 直接相关(含于冕服)
6 ⚠️ 部分相关(须排除"衣宝玉"等非服饰义)
2 ✅ 相关(垂衣裳)
1 ✅ 直接相关(绨袍)
1 ✅ 相关(弓裘衣冠)
冕服 1 ✅ 直接相关
服色 1 ✅ 直接相关
4 ⚠️ 部分相关(佩玉玦、佩剑、环佩、佩印)
1 ✅ 相关(印绶)
2 ⚠️ 非服饰用途(帛书、竹帛)
1 ⚠️ 织物贸易(贩缯)
0
0
绿 0
3 ❌ 均为人名(卫青)
16 ❌ 均为非服饰义(黄帝/黄老/黄金等)
8 ❌ 均为非服饰义(白鱼/白璧/太白等)
0
7 ❌ 均为人名(丹朱/朱建/朱子等)
0
其余60个关键词 0

有匹配的关键词:16个 确认服饰相关:冠、冕、衣、裳、袍、裘、冕服、服色、佩、绶(10个) 非服饰义项排除:黄、白、朱、青(4个颜色词均为非服饰义) 织物/间接相关:帛、缯(2个)

步骤3:行号提取与上下文还原

步骤4:语义审核

逐条审核每个匹配的语境,区分:

三、关键发现

发现1:冠制讨论为本书服饰核心

发现2:衣裳为上古治道象征

发现3:优孟衣冠条最具服饰研究价值

发现4:冕服仅1处但意义重大

四、审核结果

审核项 结果
是否整本载入LLM ❌ 否,仅用grep+sed提取
关键词覆盖度 ✅ 76个关键词全覆盖
非服饰义项排除 ✅ 黄/白/朱/青已排除
语境还原 ✅ 每条含上下文
产出文件数 3份MD
单文件大小限制 ≤20KB