研究总结 日志 原文

《班马异同》服饰史料处理日志

基本信息

项目 内容
源文件 /home/z/my-project/upload/zhengshi/正史/班马异同.txt
输出目录 /home/z/my-project/upload/正史重制output/班马异同/
文件编码 UTF-8
总行数 642行
最长行 10466字(匈奴列传)
产出文件 班马异同_总结.md / 班马异同_日志.md / 班马异同_原文提取.md

处理步骤

步骤1:wc -l 统计行数

步骤2:grep -c 统计服饰关键词命中数

步骤3:grep -n 提取关键词行号

步骤4:sed上下文提取

步骤5:撰写3份MD

班马异同_总结.md

班马异同_日志.md(本文件)

班马异同_原文提取.md

噪音过滤说明

关键词 原始命中 噪音类型 过滤方式
43行 多为人名/地名(黄屋、黄龙等非服饰色) 不纳入服饰色统计
35行 多为形容词(白鹿、白狼、肥白等) 仅保留明确服饰语境
24行 多为地名/人名(青衣、青虬等) 仅保留明确织物色
18行 "带河""带甲""带剑""带同师"等非服饰 区分腰带/佩带 vs 地势/动词
36行 "冠军""冠玉""冠诸侯""位冠群臣"等 区分冠帽 vs 冠军/冠绝
45行 "衣食""布衣""衣褐"为服饰;"衣衾"为丧具 按语境分类

关键词完整命中统计

关键词 命中行数 备注
45 含布衣/衣褐/衣裘/儒衣/衣帛等
43 多非服饰语境
36 含刘氏冠/儒冠/冠带/冠军等
35 多非服饰语境
24 多非服饰语境
21 多为朱中/丹朱等
18 含地带/佩带/带甲/带剑等
18 金帛/束帛/币帛等
8 印绶(均为职官信物)
7 佩印绶/佩之(均为佩戴义)
7 纎罗/罗钟鼓/罗者/雀罗
7 贩缯/絮缯/奇缯
6 旃裘/羊裘/狐裘
5 衣褐/裋褐
5 锦绣/文锦/锦袷袍
冠带 5 弃冠带/冠带之伦/冠带衣履
4 缟素/鲁缟/纻缟
服色 4 正朔服色/改正朔易服色
3 绮縠/绣袷绮衣/绮里季(人名)
中衣 2 中衣袴
2 长襦/罗襦
章服 2 异章服/殊章服
车服 2 车服黄屋左纛/宫室车服
1 衣裘裳
1 锦袷袍
丧服 1 匈奴丧服
1 紫贝
1 尚上黑
1 丹青赭垩
1 一簪不得着身
1 屈虹为绸
服制 1 以礼为服制

处理时间