研究总结 日志 原文

《辛巳泣蕲录》服饰内容提取日志

基本信息

Step 1:wc -l 统计

98 /home/z/my-project/upload/part4/辛巳泣蕲录.txt

文件较小(98行),但每行较长(为连续叙述段落),需逐行grep定位。

Step 2:多轮grep -n

第一轮:核心词grep

grep -n '服色|舆服|冠服|章服|衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'

命中行号:1, 2, 3, 4, 5, 7, 8, 9, 10, 12, 13, 14, 15, 17, 18, 19, 20, 21, 22, 25, 26, 28, 29, 30, 32, 33, 34, 35, 37, 40, 41, 43, 80

大量命中因"衣""带""布"等高频字出现在非服饰语境(如"衣甲""布袋""地带"等),需二次筛选。

第二轮:制度词grep

grep -n '赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'

命中:L80(追赐紫章服)

仅1处命中制度词,本书非制度文献,服饰信息散见于战事实录。

第三轮:装饰词grep

grep -n '黼黻|文章|纹|绣|织|染|彩|画'

命中:L3(织出现在非服饰语境),装饰词在本书中几乎无直接命中。

第四轮:动作词grep

grep -n '服|冠|戴|穿|著|被|披|裹|束|系'

命中行号极多(服、被、著等高频字),需人工二次筛选服饰语境。

第五轮:专用服饰词grep(精准筛选)

grep -n '袍|裘|兜鍪|兜牟|铁甲|皮甲|软缠|毡|蓑衣|草鞋|皮靴|朝服|紫章服|绿布衫'

精准命中行号:3, 4, 5, 7, 8, 9, 10, 13, 17, 20, 21, 25, 29, 30, 32, 33, 37, 40, 80

Step 3:sed提取关键片段

行号 sed命令 提取内容
L3 sed -n '3p' | rg -o '纸兜鍪[^。]*。' 纸兜鍪一千副
L3 同上 铁甲大小共有五百副,兜鍪五百二十副
L4 sed -n '4p' | rg -o '纸兜牟[^。]*。' 纸兜牟一千副,纸软缠五百副
L5 sed -n '5p' | rg -o '着[绿白]布袍' 着绿布袍/着白布袍
L7 sed -n '7p' | rg -o '软缠[^,]*' 软缠一副
L8 sed -n '8p' | rg -o '皮甲[^,]*' 皮甲数副
L9 sed -n '9p' | rg -o '衣服色号[^。]*。' 衣服色号及年甲
L9 同上 著软缠,干粮在腰
L10 sed -n '10p' | rg -o '蓑衣[^。]*。' 身披蓑衣
L13 sed -n '13p' | rg -o '毡帘[^。]*。' 毡帘遮护
L17 sed -n '17p' | rg -o '衣长甲[^。]*。' 衣长甲军坐于交椅之上
L20 批量提取 番笠、番毡、大小毡十五副、皮牌
L21 批量提取 白布包头、着红衣、番毡九床
L25 批量提取 衣朝服与在城寄居有官无官宗室
L29 批量提取 销金鞍一副
L30 批量提取 番绵裘五条、皮靴
L32 批量提取 皮帘
L33 批量提取 毡幔云梯、毡连头面裹其体
L37 批量提取 绿布衫、身衣军服、擐甲登城、湿毡
L40 批量提取 白袍犹未脱体
L80 批量提取 紫章服(两处)、银绢二百匹两

Step 4:分类整理

经人工研判,剔除以下非服饰语境命中:

保留20条有效服饰条目,分五类整理:

  1. 官服与品色制度(4条)
  2. 军服与甲胄(13条)
  3. 金方服饰(9条)
  4. 民间与特殊服饰(6条)
  5. 纺织品与赏赐物(3条)

Step 5:产出文件

文件名 大小 内容
辛巳泣蕲录_总结.md ~8KB 分类总结与分析
辛巳泣蕲录_日志.md 本文件 提取过程记录
辛巳泣蕲录_原文提取.md ~10KB 原文片段逐条提取