研究总结 日志 原文

《静居集》服饰提取日志

基本信息


提取流程

Step 1: wc -l 统计

1626 /home/z/my-project/upload/四库别集3/四库别集3/静居集.txt

Step 2: 8轮关键词grep -n 提取

第1轮:冠冕弁帻帽巾幞头进贤冠武冠

grep -n '冠|冕|弁|帻|帽|巾|幞头|进贤冠|武冠' 静居集.txt

命中行:68, 120, 168, 176, 200, 264, 486, 500, 516, 530, 580, 626, 928, 1056, 1112, 1530, 1600, 1612

第2轮:衣裳袍衫袄褂襦褐裘袈裟

grep -n '衣|裳|袍|衫|袄|褂|襦|褐|裘|袈裟' 静居集.txt

命中行:38, 84, 96, 100, 120, 128, 168, 188, 192, 196, 208, 212, 228, 244, 276, 306, 334, 384, 456, 460, 472, 504, 530, 534, 542, 576, 584, 620, 626, 640, 656, 664, 676, 700, 716, 724, 762, 812, 832, 840, 856, 874, 886, 908, 944, 966, 980, 1024, 1064, 1076, 1100, 1116, 1128, 1150, 1162, 1366, 1386, 1390, 1454, 1606, 1608

第3轮:裙裤履舄靴袜鞋

grep -n '裙|裤|履|舄|靴|袜|鞋' 静居集.txt

命中行:56, 200, 680, 720, 1322

第4轮:带佩笏绶鱼袋玉带金带银带

grep -n '带|佩|笏|绶|鱼袋|玉带|金带|银带' 静居集.txt

命中行:120, 176, 184, 240, 276, 334, 408, 484, 542, 604, 728, 736, 806, 856, 966, 1044, 1154, 1218, 1332, 1358, 1500, 1528

第5轮:锦绮帛绢绫罗缎绸缂丝纱

grep -n '锦|绮|帛|绢|绫|罗|缎|绸|缂丝|纱' 静居集.txt

命中行:168, 350, 538, 542, 580, 626, 656, 704, 712, 728, 1104, 1128, 1186, 1512, 1530

第6轮:丝麻葛布裘棉缯缣

grep -n '丝|麻|葛|布|裘|棉|缯|缣' 静居集.txt

命中行众多,大量"丝"字用于"丝弦""丝雨""鬓如丝"等非服饰语境,需逐一排查

第7轮:染色绣纹黼黻章赭朱紫绯青

grep -n '染|色|绣|纹|黼|黻|章|赭|朱|紫|绯|青' 静居集.txt

命中极多,"青""紫""朱""色"等大量用于山水颜色描写,需严格筛选服饰语境

第8轮:赐服赐衣赐紫赐绯赐袍赐带

grep -n '赐服|赐衣|赐紫|赐绯|赐袍|赐带' 静居集.txt

命中:0行


对抗审查:去重去误

去误(排除非服饰语境)

  1. L486 "弁山巻" → 弁山为地名,非冠弁
  2. L500 "弱冠" → 年龄称谓,非服饰
  3. L928 "滤药巾" → 滤药用布,非头巾服饰
  4. L56 "履其境" → 履为动词"行走",非鞋履
  5. L184 "江水渺如带" → 比喻江河形状,非衣带
  6. L408 "芳英带露折" → 带为动词"携带",非腰带
  7. L806 "带雨共归村" → 带为动词"携带"
  8. L966 "鴈带新凉" → 带为动词"带来"
  9. L1044 "疎林带水" → 带为"连接"意
  10. L1154 "暖带落花风" → 带为动词
  11. L1218 "弓劔随身带" → 带为动词"携带"
  12. L1358 "并带落花香" → 带为动词
  13. L538 "千树锦" → 锦喻繁花
  14. L580 "金错刀" → 画法名称
  15. L1186 "绿绮" → 琴名,非织物
  16. L534 "白云如白衣" → 白衣为喻云,非实指服饰
  17. L676 "化衣" → 化衣为僧人化缘衣,确认保留

去重(同一行跨轮重复)

最终统计

去重去误后服饰相关行约85行,有效服饰条目85条(含跨行合并与同行拆分)。


提取方法说明