钦定辽金元三史国语解 — 处理日志
任务信息
| 项目 |
内容 |
| 输入文件 |
/home/z/my-project/upload/zhengshi/正史/钦定辽金元三史国语解.txt |
| 输出目录 |
/home/z/my-project/upload/正史重制output/钦定辽金元三史国语解/ |
| 处理日期 |
2026-03-04 |
步骤记录
Step 1: wc -l
Step 2: grep -c 关键词命中统计
| 关键词 |
命中数 |
关键词 |
命中数 |
| 冠 |
3 |
巾 |
2 |
| 帽 |
11 |
衣 |
11 |
| 裳 |
1 |
袍 |
7 |
| 衫 |
1 |
袄 |
2 |
| 褐 |
4 |
裙 |
2 |
| 朝服 |
1 |
紫 |
1 |
| 绿 |
1 |
青 |
84 |
| 黄 |
89 |
白 |
93 |
| 黑 |
40 |
朱 |
5 |
| 佩 |
7 |
带 |
128 |
| 绶 |
2 |
帛 |
3 |
| 罗 |
183 |
锦 |
33 |
| 缎 |
3 |
绸 |
1 |
其余关键词命中为0:冕、弁、帻、幞头、进贤冠、武冠、通天冠、远游冠、半袖、衮服、冕服、祭服、常服、公服、法服、章服、燕服、丧服、赭、笏、鱼袋、鞶囊、香囊、簪、钗、步摇、舆服、车服、卤簿、仪仗、绢、绮、绫、纱、缯、缟、纨、赐服、赐紫、赐绯、借紫、借绯、服制、冠制、品色、服色、冠带
Step 3: grep -n 行号定位
- 冠帽类:16条命中有服饰义
- 衣裳类:28条命中有服饰义
- 服制类:2条命中
- 颜色类:120+条命中(大量为地名/人名修饰语)
- 佩饰类:70+条命中("带"最多,需甄别)
- 舆服/车服/卤簿/仪仗:0条命中
- 纺织类:120+条命中("罗"占绝大多数,多非丝织品义)
Step 4: sed 上下文提取
- 对服饰义明确的条目逐行提取全文
- 共提取关键条目约60条(排除纯地名/人名中的颜色修饰语)
Step 5-6: 撰写3份MD并写入
甄别说明
- "带"字甄别:128条命中中,约90%为蒙古语"岱/带"(意为"有也"),系人名地名尾缀,非服饰佩带之义。仅约15条与服饰带相关(陶罕=带板、布色=带子、鄂伦=肚带、托海=带饰/带极、苏布特齐=带珍珠人)。
- "罗"字甄别:183条命中,绝大多数为音译人名/地名成分,非丝织品"罗"。
- 颜色词甄别:青/黄/白/黑等高频色词多为地名/人名修饰语(如"博啰=青色"修饰山名),而非服饰颜色描述,但反映了辽金元服饰品色的语言根基。
- "衣"字甄别:地理条中"衣卷怢"系"依卷帙"之意,非服饰。
输出文件
| 文件名 |
说明 |
| 钦定辽金元三史国语解_总结.md |
服饰相关总结分析 |
| 钦定辽金元三史国语解_日志.md |
本文件,处理日志 |
| 钦定辽金元三史国语解_原文提取.md |
服饰相关原文提取 |