韩愈集 服饰提取工作日志
任务信息
- 源文件:/home/z/my-project/upload/四库别集3/四库别集3/韩愈集.txt
- 输出目录:/home/z/my-project/upload/四库别集3output/韩愈集/
- 执行时间:2026-03-04
执行步骤
步骤1:文件检测
wc -l结果:2998行- 创建输出目录成功
步骤2:8轮关键词grep提取
| 轮次 | 关键词 | 命中行数(含注释) | 有效服饰行 |
|---|---|---|---|
| 1 | 冕弁帻帽巾幞头冠 | ~25行 | 12行 |
| 2 | 衣裳袍衫袄褂襦褐裘袈裟 | ~40行 | 18行 |
| 3 | 裙裤履舄靴袜鞋 | ~12行 | 6行 |
| 4 | 带佩笏绶鱼袋玉带金带银带 | ~30行 | 10行 |
| 5 | 锦绮帛绢绫罗缎绸缂丝纱 | ~18行 | 8行 |
| 6 | 丝麻葛布裘棉缯缣 | ~25行 | 9行 |
| 7 | 染色绣纹黼黻章赭朱紫绯青 | ~35行 | 12行 |
| 8 | 赐服赐衣赐紫赐绯赐袍赐带 | ~15行 | 12行 |
步骤3:汇总分类
- 去重合并后有效服饰行约87行
- 按八大类别分类
步骤4:对抗审查
误报排除
- L155"丝竹徒轰轰"——丝竹为乐器,非服饰,排除
- L112"缕脉碎分绣"——绣指山纹如绣,非服饰刺绣,降级为间接引用
- L67"服,亦佩也"——注释用语,"服"为穿着意,纳入但标注
- L78"斥遣浮华"——浮华指奢华风气,非直接服饰,排除
- L131"绸缪"——绸缪为紧密缠缚意,非丝绸服饰,排除
- L155"丝竹徒轰轰"——乐器,排除
- L360"衣被如刀镰"——衣被为动词覆盖意,但与服饰相关,保留
- L422"蚕茧纸"——纸名,非服饰用蚕茧,排除
漏报补充
- L78"以红帕首"——帕首为军容头饰,重要,已纳入
- L343"彤幢绛旃紫纛幡"——仪仗旗帜服饰,已纳入
- L628"朝冠飘彩"——朝冠服饰,已纳入
- L2846"衫笏赐登"——衫为官服,笏为朝具,已纳入
步骤5:撰写三份MD
- 韩愈集_总结.md
- 韩愈集_日志.md(本文件)
- 韩愈集_原文提取.md
步骤6:字节数验证
待执行
注意事项
- 本集含大量注释(方崧卿校语),服饰关键词常出现在注释中,需区分原文与注
- 碑志文中的官衔(赐紫金鱼袋等)为制度性服饰记录,具有史料价值
- 诗作中的服饰描写多为比兴用法,需结合语境判断