《湛然居士文集》服饰提取工作日志
任务信息
| 项目 | 内容 |
|---|---|
| Task ID | batch-r2-d |
| 书名 | 湛然居士文集 |
| 源文件 | /home/z/my-project/upload/四库别集/湛然居士文集.txt |
| 输出目录 | /home/z/my-project/upload/四库别集output/湛然居士文集/ |
| 文件总行数 | 3449行 |
操作流程
Step 1: 创建输出目录
mkdir -p /home/z/my-project/upload/四库别集output/湛然居士文集/- 结果:成功
Step 2: 查看文件行数
wc -l→ 3449行
Step 3: 五轮grep扫描
R1: 核心服饰词
- 关键词:衣、裳、袍、衫、裙、裘、褐、衮、帔、袂、袈裟、禅衣、法衣、道服、朝服、戎服、深衣、帷裳等
- 命中行数:约50行
- 关键发现:征衣铁、缊袍、衲衣、戎服貂裘紫、锦衣捐毳褐、屈眴轻衫、白衣裳等
R2: 冠帽佩饰词
- 关键词:冠、冕、弁、帽、巾、帻、簪、钗、佩、绶、带、钩、鱼袋、笏、玉佩、幞头、乌纱等
- 命中行数:约35行
- 关键发现:角巾、醉帽、乌帽、玉佩、金钗、花冠、衮冕、簪、钗钏等
- 排除:大量"冠"作动词用法(冠士林、冠一时等)
R3: 丝织品类词
- 关键词:锦、绮、罗、缎、绢、纱、绫、绸、缯、帛、纨、绡、绣、缬等
- 命中行数:约40行
- 关键发现:绞绡帕、罗纨、素罗裳、罗袜、织锦文、绢八万匹等
- 排除:大量"绮语"非服饰用法、锦城(地名)
R4: 材料染织词
- 初次扫描因匹配量过大(丝、白、青等常见字)导致超时
- 改用精准词扫描:毡、罽、褐、毳、毯、蚕桑、木绵、垄种羊、貂裘等
- 命中行数:约20行
- 关键发现:毡庐、毳衲、毛毯、无蚕桑/植木绵、貂裘紫、茧丝五榖
R5: 鞋履制度词
- 关键词:履、屦、屐、靴、鞋、袜、鞾、舄、布衣、冠服、朝服、戎服、胡服等
- 命中行数:约15行
- 关键发现:芒鞋、草鞋、布韈青鞋、破帽麻鞋、皮鞋、屣、緉屐
Step 4: 关键行上下文提取
- 用sed提取L970、L1358、L2580、L2691、L1157等关键行的前后文
- 确认屈眴为西域布(渐西本注)、确认"西人多服白衣"为夹注、确认"角巾折暮雨"语境
Step 5: 过滤非服饰用法
排除条目:
- "衣被天下"(比喻)、"绮语"(6处,均非服饰)、"冠士林"等冠作动词(约8处)、"锦城"(地名2处)、"碧纱笼"(非服饰)、"箕裘"(典故2处)、"登科年甫冠"(成年礼)、"乌衣"(燕子)
- 共排除约22条非服饰用法
Step 6: 撰写三份MD文档
- 湛然居士文集_原文提取.md — 含行号引用,关键词加粗,按六大类分节
- 湛然居士文集_总结.md — 结构化综述+对抗式学术审查
- 湛然居士文集_日志.md — 本文件
统计数据
| 指标 | 数值 |
|---|---|
| 处理总行数 | 3449 |
| grep扫描命中行(去重前) | 约160行 |
| 排除非服饰用法 | 约22条 |
| 有效服饰条目 | 约50条 |
| 核心发现 | 3项(衣冠制度坚持、西域民族志价值、丝织经济制度) |
核心发现摘要
- 衣冠制度:耶律楚材作为契丹士人在蒙古朝廷中力主华夏衣冠礼制,"衣冠师古""衣冠万国同"等表述体现文明认同
- 西域服饰民族志:屈眴(西域棉布)、白衣裳(中亚尚白传统)、木绵(棉花种植)、毡帐生活——为13世纪中亚服饰的一手资料
- 丝织赋税制度:L3260-3267记载的税丝制度(二户出丝一斤供官、五户出丝一斤赐贵族)为元代经济史关键文献
异常与备注
- R4首轮扫描超时(常见字匹配量过大),改用精准词二次扫描完成
- "屈眴"一词渐西本注"西域布",但未明棉/麻,结合"无蚕桑""植木绵"语境推断为棉织品
- "垄种羊"为棉花之神话化表述,楚材沿用此说反映当时汉地对棉花的认知局限