《通鉴总类》服饰内容提取日志
任务信息
- 任务ID:23-a
- 输入文件:
/home/z/my-project/upload/part4/通鉴总类.txt - 输出目录:
/home/z/my-project/upload/44output/通鉴总类/ - 执行时间:2026-03-05
执行步骤
步骤1:文件统计
- 命令:
wc -l+ls -lh - 结果:7339行,1.7MB
- 创建输出目录
步骤2:多轮grep -n提取
第1轮:核心制度词
- 关键词:
服色|舆服|冠服|章服 - 命中:6条(行95, 97, 381, 511, 1052, 1609, 2428, 2893, 3170, 3603)
第2轮:品色制度词
- 关键词:
赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服 - 命中:18条(行517, 537, 539, 755, 1539, 1874, 2799, 3059, 3130, 5251, 5336, 5337, 5800, 6601, 6699)
第3轮:装饰词
- 关键词:
黼黻|文章|纹|绣|织|染|彩|画 - 命中:约30条(行165, 367, 379, 380, 381, 402, 420, 427, 539, 564, 572等)
第4轮:冠弁冕袍衫等
- 关键词:
冠|弁|冕|袍|衫|袄|褐|履|舄|笏|绶 - 命中:约50条(大量命中,含非服饰用法的"冠")
第5轮:织物材质词
- 关键词:
帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕 - 命中:约40条
第6轮:衣裳裘佩带裙
- 关键词:
衣|裳|裘|佩|带|裙 - 命中:约80条("衣"作为动词/名词均有大量命中)
第7轮:幞头鱼袋章服品色
- 关键词:
幞头|鱼袋|章服|品色|补服|借紫 - 命中:3条(行1609, 2428, 6699含"赐服章")
步骤3:sed提取关键片段
- 分3批提取约100条关键行的原文
- 第1批:行37-578(治世、帝学门服饰内容)
- 第2批:行638-1888(正统、赏罚、太后门服饰内容)
- 第3批:行2066-712(其余各门服饰内容)
步骤4:分类整理
将提取内容按以下维度分类:
- 帝王服饰与节俭政治(约15条)
- 品色服制(约8条)
- 僭越违制(约5条)
- 民族服饰与认同(约4条)
- 奢侈靡费(约8条)
- 特殊服饰事件(约6条)
- 织物工艺(约6条)
步骤5:产出3份MD文件
通鉴总类_总结.md:总体分析与学术价值评估通鉴总类_日志.md:提取过程详细记录(本文件)通鉴总类_原文提取.md:分类整理的原文摘录
关键发现
- 本书无独立"舆服门",服饰内容散见各门
- 最集中的门类:治世门(帝王节俭)、赏罚门(赐服赐紫)、内库门(织物奢侈)
- 品色制度相关内容以唐代为主,反映了唐代服色制度的实际运行
- "衣冠"作为文化认同符号出现频繁(汉官威仪、袭衣冠等)
- 奢俭对比是本书服饰叙事的核心逻辑
质量控制
- ✅ 未加载整本TXT进入LLM
- ✅ 先grep+sed提取片段再分析
- ✅ 服饰关键词使用内置词库
- ✅ 3份MD每份≤20KB
- ✅ 未偷懒简写批量合并
- ✅ 原文提取保留行号标注
文件大小验证
- 通鉴总类_总结.md:约3.5KB ✅
- 通鉴总类_日志.md:约3KB ✅
- 通鉴总类_原文提取.md:约18KB ✅