《钱塘遗事》服饰提取工作日志
任务基本信息
| 项目 | 内容 |
|---|---|
| 任务ID | 30-b |
| 文献 | 《钱塘遗事》(元·刘一清) |
| 输入路径 | /home/z/my-project/upload/part4/钱塘遗事.txt |
| 输出路径 | /home/z/my-project/upload/44output/钱塘遗事/ |
| 执行时间 | 2026-03-05 |
| 文件行数 | 550行 |
执行步骤记录
步骤1:wc -l 行数统计
wc -l /home/z/my-project/upload/part4/钱塘遗事.txt
# 结果:550行
550行属于中小型文献,适合逐行grep精确检索。
步骤2:多轮grep -n检索
按关键词类别分7轮检索:
第1轮:核心词(服色|舆服|冠服|章服)
- 命中:1处(第451行"服色")
- 关键发现:元帝谕令"不要改变服色"
第2轮:核心词(衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕)
- 命中:约20处
- 关键发现:御衣、绿袍、黄袍、缁冠素履、袍笏、幞头、笏等
- 误判排除:"衣带一江"为比喻用法,非服饰实指,但"衣"字确实涉及,保留备注
第3轮:核心词(袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸)
- 命中:约15处
- 关键发现:绿袍、黄袍、绿衫、罗绮、绢、帛、锦等
- 重要:科举赐服明细(淡黄绢衫、淡黄绢带、绿罗公服)
第4轮:核心词(丝|布|葛|麻|棉|茧|蚕)
- 命中:约8处
- 关键发现:布帛、布被、麻衣、养蚕
- 误判排除:"丝"多用于"丝竹"等非织物语境,筛除
第5轮:制度词(赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服)
- 命中:6处
- 关键发现:赐绯3例、幞头+宫花、紫袍、绿袍
第6轮:装饰词(黼黻|文章|纹|绣|织|染|彩|画)
- 命中:约10处
- 关键发现:彩衣、真彩、销金、画桥(非服饰,筛除)
- 多数"画"为书画/建筑用词,非服饰装饰
第7轮:动作词(服|冠|戴|穿|著|被|衣|披|裹|束|系)
- 命中:约30处
- 关键发现:微服、披发缨冠、被甲、戴笠、身着、挂冠等
- 大量"服"为"服丧""不服"等非服饰用法,逐条筛选
步骤3:sed上下文提取
对关键行号执行sed提取,确保上下文完整:
| 提取范围 | 目的 |
|---|---|
| 9-13 | 梦吴越王引御衣上下文 |
| 39-48 | 万回哥哥彩衣+绿袍方巾+何蓑衣 |
| 68-72 | 济王黄袍加身 |
| 112-120 | 巾履+吴潜大带深衣缁冠素履 |
| 178-183 | 李鋕挂冠脱绿袍 |
| 448-456 | 服色等级+元帝谕令 |
| 489-544 | 科举赐服全过程 |
| 384-390 | 赐绯三例 |
步骤4:分类整理
将提取结果归为七大类:
- 品官服色与制度(5条)
- 科举赐服制度(7条,核心)
- 丧葬服饰(3条)
- 民间与宗教服饰(4条)
- 军事与特殊服饰(9条)
- 纺织原料与织物(9条)
- 装饰与其他(3条)
步骤5:产出3个MD文件
| 文件名 | 内容 | 大小 |
|---|---|---|
| 钱塘遗事_总结.md | 分类概述、重要发现、信息量评估 | ~6KB |
| 钱塘遗事_原文提取.md | 40条原文逐条提取,附行号 | ~8KB |
| 钱塘遗事_日志.md | 本文件,工作过程记录 | ~4KB |
质量控制
- ✅ 未加载整本TXT进LLM,全程使用grep+sed提取
- ✅ 3个MD文件均≤20KB
- ✅ 原文提取逐条标注行号,可溯源验证
- ✅ 比喻用法("衣带一江"等)已标注说明
- ✅ 非服饰用词("丝竹""画桥"等)已筛除
- ✅ 科举赐服制度为本书服饰信息最密集段落,已完整提取
特别说明
本书服饰信息特点:《钱塘遗事》为南宋政治史笔记,非舆服专书,服饰信息散见各卷,以卷十"赴省登科五荣须知"最为集中。
最具史料价值发现:
- 南宋科举赐服物件清单(淡黄绢衫、淡黄绢带、绿罗公服、笏)为极罕见的一手详细记录
- 元初"不要改变服色"政策记载,对服色制度史研究有重要意义
- 吴潜"大带深衣,缁冠素履"自铭,为南宋士大夫丧服完整描述
检索局限:550行文献中大量"衣""服"等动作词出现于非服饰语境,需人工判断筛选,grep无法自动排除。