元丰类稿 · 服饰提取日志
任务编号:batch4-c-01
处理日期:2025-03-05
操作者:AI助手
一、基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 元丰类稿 |
| 作者 | 曾巩(宋) |
| 文件路径 | /home/z/my-project/upload/四库别集/元丰类稿.txt |
| 文件大小 | 1,109,091 字节 |
| 输出目录 | /home/z/my-project/upload/四库别集output/元丰类稿/ |
二、五轮扫描记录
第一轮:衣裳袍裘(衣|裳|袍|裘|袂|襟|裾|袴|褐|襦|褕|襖|裲|袿|襌|袟|裎|袒|裋)
- 命中行数:196
- 过滤后有效条目:约35条
- 亮点:宫袍、笏袍、霓裳、仙衣、短褐、麻衣、布裘、敝衣、丧服体系
第二轮:冠冕弁巾(冠|冕|弁|巾|帻|帽|簪|缨|緌|纮|綖|步摇|进贤)
- 命中行数:116
- 过滤后有效条目:约25条
- 亮点:峨冠、冕旒、衮服貂冠、角巾、岸帻、垫巾、抽簪、两梁冠
第三轮:锦绮帛绢(锦|绮|帛|绢|绫|罗|绸|缎|缯|缣|纱|绡|绨|绯|紫|章服)
- 命中行数:150
- 过滤后有效条目:约20条
- 亮点:罗绮厌、吴缣、锦绣、昼锦、绯衣银鱼、紫衣金鱼、绮绣
第四轮:丝麻葛布(丝|麻|葛|布|纩|絮|绵|纺|绩|织|缟|纻|絺|绤)
- 命中行数:201
- 过滤后有效条目:约15条
- 亮点:絺绤、竹林散絺葛、箔蚕、丝人归织絍、缣缃
第五轮:履舄靴鞋制度词(履|舄|靴|鞋|韈|袜|带|鞶|绶|佩|玉|环|笏|节|旒|旗|纛)
- 命中行数:516
- 过滤后有效条目:约30条
- 亮点:青鞋赤舄、笋鞋、登山屐、笏板、节旄、佩玉、委佩垂绅
三、过滤说明
过滤原则
- 非服饰语境剔除:如"冠于天下""冠于甲令"等非服饰用法;"丝管"指音乐;"紫气"为祥瑞;"黄金""白玉"为材质非服饰;"旗""纛"属军旗不归服饰。
- 泛指保留:如"衣冠"作为士大夫代称,因涉及社会阶层服饰标志,予以保留。
- 制度词重点提取:丧服(齐衰、缌麻、袒免)、赐服(绯衣银鱼、紫衣金鱼)、礼制(弁冕、画衣冠)等制度性词汇优先提取。
误报统计
- "冠于"类(非服饰冠):约15条
- "丝管/丝竹"(音乐):约8条
- "紫气/紫宸"(非服饰紫):约10条
- "玉"非佩玉:约20条
- "环"非佩环:约5条
四、输出文件
| 文件名 | 大小说明 |
|---|---|
| 元丰类稿_原文提取.md | ≤20KB,含分类原文约70条 |
| 元丰类稿_总结.md | ≤20KB,含分类分析、价值评估 |
| 元丰类稿_日志.md | ≤20KB,本文件 |
五、处理耗时
- grep扫描:约3分钟
- 上下文提取与过滤:约5分钟
- 文档撰写:约5分钟
- 总计:约13分钟
日志完毕