书经大全·服饰内容提取日志
基本信息
- 文件路径:/home/z/my-project/upload/尚书/尚书/书经大全.txt
- 文件大小:1,158,603字节
- 总行数:2,829行
- 最长行:3,566字符
- 输出目录:/home/z/my-project/upload/尚书output/书经大全/
五轮Grep结果
Round 1:衣/裳/裘/弁/冕/服
| 关键词 |
命中行数 |
服饰义行数 |
| 衣 |
56 |
10 |
| 裳 |
8 |
5 |
| 裘 |
7 |
3 |
| 弁 |
13 |
7 |
| 冕 |
16 |
12 |
| 服 |
211 |
22 |
Round 2:冠/带/佩/舄/芾/韨
| 关键词 |
命中行数 |
服饰义行数 |
| 冠 |
16 |
4 |
| 带 |
6 |
1 |
| 佩 |
10 |
0 |
| 舄 |
0 |
0 |
| 芾 |
0 |
0 |
| 韨 |
0 |
0 |
Round 3:黼/黻/绣/衮/皮弁/章服
| 关键词 |
命中行数 |
服饰义行数 |
| 黼 |
15 |
10 |
| 黻 |
3 |
3 |
| 绣 |
5 |
3 |
| 衮 |
11 |
6 |
| 皮弁 |
2 |
2 |
| 章服 |
0 |
0 |
Round 4:玄衣/黄裳/赤舄/采服/锡服/絺冕
| 关键词 |
命中行数 |
服饰义行数 |
| 玄衣 |
0 |
0 |
| 黄裳 |
0 |
0 |
| 赤舄 |
0 |
0 |
| 采服 |
2 |
0(均地域义) |
| 锡服 |
0 |
0 |
| 絺冕 |
2 |
2 |
Round 5:五服/五采/山龙/华虫/宗彝/藻火/粉米
| 关键词 |
命中行数 |
服饰义行数 |
| 五服 |
20 |
2 |
| 五采 |
6 |
4 |
| 山龙 |
1 |
1 |
| 华虫 |
3 |
3 |
| 宗彝 |
4 |
2 |
| 藻火 |
1 |
1 |
| 粉米 |
2 |
2 |
噪声排除详情
"服"字噪声(约189行非服饰义)
- 五服=地域区划义:约16行(L866, L928, L1263, L1974, L2019, L2484, L2509, L2511, L2536等)
- 服=刑罚/服从义:约5行(L928, L929)
- 服=服事/从事义:约30行
- 服=服丧义:约5行
- 服=服用/行用义:约10行
- 其他:约123行
"衣"字噪声(约46行非服饰义)
- 一戎衣=军事行动义:L1807, L1812
- 缀衣=幄帐义:L2602, L2610, L2611
- 垂衣拱手=比喻义:L2677
- 衣=动词穿:L969
"冠"字噪声(约12行非服饰义)
- 冠其篇首=前置义:L60
- 冠石山=地名:L1112
"佩"字噪声(10行全部非服饰义)
- 背音佩=音释标注:无
- 佩=违背义:多数
- 佩=佩服义:少数
"五服"噪声(约18行非服饰义)
- 五服=地域义占90%
- 仅L1010(五服五章)和L1032(弼成五服)部分涉及服饰义
上下文提取
- 共对22个关键行进行Python上下文提取
- 提取范围:前后0-2行,截取400-500字符
- 全程使用Python脚本,未使用bash sed(避免UTF-8编码问题)
输出文件
- 书经大全_总结.md(3,721字节)
- 书经大全_日志.md(本文件)
- 书经大全_原文提取.md