研究总结 日志 原文

静春堂集 服饰提取日志

基本信息

项目 内容
书名 静春堂集
作者 元·袁易
文件路径 /home/z/my-project/upload/四库别集3/四库别集3/静春堂集.txt
总行数 693
执行时间 2025年

执行步骤

步骤1:文件验证与行数统计

wc -l 静春堂集.txt → 693行

文件正常,693行,为小型别集。

步骤2:8轮关键词grep

第1轮:冠冕弁帻帽巾幞头进贤冠武冠

rg -n "冠|冕|弁|帻|帽|巾|幞头|进贤冠|武冠" 静春堂集.txt

命中行:184, 216, 240, 244, 286, 328, 358, 526, 556, 591, 634, 660 原始命中:12行

第2轮:衣裳袍衫袄褂襦褐裘袈裟

rg -n "衣|裳|袍|衫|袄|褂|襦|褐|裘|袈裟" 静春堂集.txt

原始命中:约30行(含大量"衣"字泛用)

第3轮:裙裤履舄靴袜鞋

rg -n "裙|裤|履|舄|靴|袜|鞋" 静春堂集.txt

命中行:224, 228, 386, 463, 485, 670 原始命中:6行

第4轮:带佩笏绶鱼袋玉带金带银带

rg -n "带|佩|笏|绶|鱼袋|玉带|金带|银带" 静春堂集.txt

原始命中:9行,含大量"带"字动词用法(如"带雨""带酒")

第5轮:锦绮帛绢绫罗缎绸缂丝纱

rg -n "锦|绮|帛|绢|绫|罗|缎|绸|缂|丝|纱" 静春堂集.txt

原始命中:约25行,含大量"游丝""丝竹""蛛丝"等非服饰用法

第6轮:丝麻葛布裘棉缯缣

rg -n "麻|葛|布|棉|缯|缣" 静春堂集.txt

原始命中:2行(370、403),均为误报

第7轮:染色绣纹黼黻章赭朱紫绯青

rg -n "染|色|绣|纹|黼|黻|章|赭|朱|紫|绯|青" 静春堂集.txt

原始命中:约60行,因"青""色""章"等字高频出现而严重泛化

第8轮:赐服赐衣赐紫赐绯赐袍赐带

rg -n "赐服|赐衣|赐紫|赐绯|赐袍|赐带" 静春堂集.txt

命中:0行

步骤3:sed提取关键行

对grep命中的行号逐一用Read工具读取上下文,确认服饰语境。

步骤4:对抗审查

4.1 误报剔除

行号 关键词 剔除原因
172 "缥缈带皓鹤",动词"携带"
176 "冈峦带重闉",动词"连带"
287 "余发欲成丝",指头发如丝
296 "吾道叹如丝",比喻
306 "桃蕚带云归",动词
337 "长带雨",动词
345 "日带寒阴",动词
370 (误报) 行内无可匹配字符,疑似编码问题
387 "带酒闻",动词
403 "诸葛",人名
434 "游丝",蜘蛛丝/飘絮
463 "丝簧",乐器弦
476 "水带冰凘",动词
497 "乌丝",墨格笺纸
497 "锦瑟",乐器
503 "游丝"
603 "蛛丝"
607 "丝竹",音乐
626 "绮疏",窗格,建筑非服饰
646 "黄金捻作丝",柳条比喻
680 "游丝"

共计剔除误报:21条

4.2 遗漏补充

行号 关键词 补充原因
352 短蓑 雨具服饰,第2轮未单独列出
485 "似繁缟",白绢面料,第5轮漏收
620 簪绂 官服配件,第4轮漏收

共计补充:3条

步骤5:分类汇总

经审查后确认服饰实指条目共42条(去重后涉及42个不同行号),分6大类:

步骤6:写三份MD

文件名 内容 预估字节
静春堂集_总结.md 服饰特征总论与统计分析 ~6KB
静春堂集_日志.md 提取过程与审查记录 ~5KB
静春堂集_原文提取.md 按类别列出原文与行号 ~7KB

问题与备注

  1. 本集为小型别集(693行),服饰内容密度较低,以文人隐逸服饰为主。
  2. 第7轮关键词"青""色""章"等高频字导致大量泛化命中,需逐一审校。
  3. "带"字在古文中动词用法极多(携带、附带),第4轮命中9行中仅3行涉及服饰带饰。
  4. 全书无赐服记录,与袁易隐逸不仕的身份完全吻合。