《读史记十表》服饰关键词提取日志
处理信息
| 步骤 |
操作 |
结果 |
| 1 |
wc -l 源文件 |
1265行 |
| 2 |
mkdir -p 输出目录 |
成功创建 |
| 3 |
grep -c 全量服饰关键词 |
60行命中(含大量非服饰语义) |
| 4 |
grep -n 精确服饰关键词(冠带/弁/冕/朝服/丧服/绶/缟素/带剑等) |
6处有效 |
| 5 |
sed -n 提取上下文 |
完成 |
| 6 |
撰写3份MD |
进行中 |
服饰关键词命中明细
全量grep(60行)→ 有效服饰语义筛选(6行)
全量grep命中的关键词包括大量非服饰用途的字符,例如:
- "衣"出现在"衣服/衣冠"之外的字词中(如"依"的偏旁等)
- "冠"多用于"冠于上"(列于首位),非指冠帽
- "带"多用于"带砺之誓"(山河带砺),非指腰带
- "黄/白/黑/青/紫"多为姓名或地名用字
- "佩/帛/锦/罗"等出现在人名或地名中
经逐一甄别,确认以下6处为有效服饰语义:
| 序号 |
行号 |
关键词 |
服饰语义 |
非服饰误判排除 |
| 1 |
433 |
带剑 |
吏佩剑制度 |
— |
| 2 |
500 |
冠带 |
冠帽与腰带(文明象征) |
— |
| 3 |
555 |
弁髦 |
弁冠与髦饰(冠礼遗俗) |
— |
| 4 |
1097 |
绶 |
官印佩绶 |
— |
| 5 |
1180 |
冠 |
以冠加号(冠字引申用法) |
— |
| 6 |
1214 |
缟素 |
白色丧服 |
— |
排除的非服饰语义命中示例
| 行号 |
命中词 |
实际语义 |
排除理由 |
| 165 |
冠 |
"不冠于十二诸侯年表之前" |
"冠"=置于首位,非冠帽 |
| 314 |
冠 |
"冠周于上" |
"冠"=列于上方,非冠帽 |
| 432 |
冠 |
"冠周于上" |
同上 |
| 553 |
冠 |
"冠秦于上" |
同上 |
| 659 |
冠 |
"冠汉帝纪年于上" |
同上 |
| 789 |
冠/带 |
"冠帝年于端"/"带砺之誓" |
冠=置首;带=山河带砺比喻 |
| 1168 |
冠 |
"冠年于上" |
冠=置于年首 |
| 1172 |
带 |
"汉不绝如帯" |
帯=如带之细,比喻 |
| 598 |
带 |
"河山带砺之誓" |
带=山河带砺比喻 |
| 多行 |
黄/白/黑/青/紫 |
姓名地名用字 |
非服色描述 |
| 多行 |
衣 |
非独立服饰语义 |
构词偏旁或泛指 |
处理方法说明
- 初筛:以完整服饰关键词表(含冠/冕/弁/衣/裳/袍/服/紫/绯/绿/青/黄/白/黑/佩/笏/带/绶/帛/绢/绮/绫/罗/锦等77个词)进行grep,共命中60行
- 复审:逐行审读命中内容,区分"服饰语义"与"非服饰语义"(如冠=动词"置于首位"、带=比喻"山河带砺"、色彩字用于姓名地名等)
- 终选:确认6处有效服饰语义,提取上下文写入原文提取文件
输出文件清单
| 文件名 |
内容 |
状态 |
| 读史记十表_总结.md |
服饰文献总结与分析 |
✓ 已写入 |
| 读史记十表_日志.md |
本文件,处理日志 |
✓ 已写入 |
| 读史记十表_原文提取.md |
服饰相关原文上下文 |
待写入 |