《金台纪闻》服饰提取日志
任务信息
| 项目 |
内容 |
| 任务ID |
32-a |
| 输入文件 |
/home/z/my-project/upload/part4/金台纪闻.txt |
| 输出目录 |
/home/z/my-project/upload/44output/金台纪闻/ |
| 执行日期 |
2026-03-05 |
执行步骤记录
步骤1:文件基本信息
$ wc -l /home/z/my-project/upload/part4/金台纪闻.txt
56 /home/z/my-project/upload/part4/金台纪闻.txt
$ stat --format=%s /home/z/my-project/upload/part4/金台纪闻.txt
14683
文件56行,14,683字节,体积较小但仍严格执行grep+sed分步提取。
步骤2:多轮grep检索
第一轮:制度词检索
关键词:服色|舆服|冠服|章服|赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服
命中行:第25行(赐玉带×多次)、第53行(幞头)
第二轮:核心词检索
关键词:衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐
命中行:第15行(衣冠)、第19行(衣笥)、第25行(玉带×多次)、第39行(冠冕)
第三轮:织物词检索
关键词:帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕
命中行:第27行(丝枲而织之)、第39行(丝-炒面搅沙糖-无关)、第47行(铜铅-无关)
第四轮:装饰词检索
关键词:黼黻|文章|纹|绣|织|染|彩|画
命中行:第27行(织之)、第43行(善画)、第49行(刻画)
第五轮:动作词检索
关键词:服|冠|戴|穿|著|被|衣|披|裹|束|系
命中行:第9行(书-无关)、第15行(便服、衣冠)、第19行(衣笥)、
第25行(赐、带)、第29行(衽席-无关)、第33行(被召-无关)、
第39行(冠冕)、第53行(幞头、公服)
步骤3:去重合并命中行
经五轮检索去重后,命中有服饰相关内容的行号:
| 行号 |
核心服饰词 |
是否确与服饰相关 |
| 15 |
便服、衣冠 |
✅ 是(官服礼仪) |
| 19 |
衣笥 |
✅ 是(服饰器物) |
| 25 |
赐玉带、玉带、赐玉、腰玉、带礼书、带衔 |
✅ 是(核心制度) |
| 27 |
丝枲、织 |
⚠️ 比喻用法 |
| 39 |
冠冕 |
⚠️ 比喻用法 |
| 43 |
画 |
❌ 排除(绘画技艺) |
| 49 |
刻画 |
❌ 排除(雕版印刷) |
| 53 |
幞头、公服 |
✅ 是(核心条目) |
步骤4:sed提取
$ sed -n '15p;19p;25p;27p;39p;53p' /home/z/my-project/upload/part4/金台纪闻.txt
成功提取6段原文。
步骤5:分类整理
| 分类 |
条目 |
行号 |
| 赐服制度 |
正德二年赐玉带沿革 |
25 |
| 冠服礼仪 |
内阁待中官之礼 |
15 |
| 冠服穿着 |
鲁铎梦幞头与公服 |
53 |
| 服饰器物 |
石鱼藏衣笥辟蠹 |
19 |
| 比喻/间接 |
丝枲而织之(文法喻) |
27 |
| 比喻/间接 |
诗人之冠冕 |
39 |
步骤6:产出MD文件
| 文件名 |
大小 |
说明 |
| 金台纪闻_总结.md |
≤20KB |
服饰提取总结与分类摘要 |
| 金台纪闻_日志.md |
≤20KB |
本日志,记录提取全过程 |
| 金台纪闻_原文提取.md |
≤20KB |
原文逐条提取与标注 |
方法论说明
- 严禁加载整本TXT进LLM:全程使用grep+sed工具链,仅提取命中片段。
- 多轮检索:分5轮按制度词→核心词→织物词→装饰词→动作词逐层过滤。
- 人工判定:对命中行逐一判断是否确与服饰相关,排除比喻、无关用法。
- 单条详注:每条原文独立标注行号、关键词、分类,严禁偷懒简写批量合并。
质量检查