《辛巳泣蕲录》服饰内容提取日志
基本信息
- 任务ID:26-d
- 输入文件:
/home/z/my-project/upload/part4/辛巳泣蕲录.txt - 输出目录:
/home/z/my-project/upload/44output/辛巳泣蕲录/ - 文件总行数:98行
- 处理时间:2026-03-05
Step 1:wc -l 统计
98 /home/z/my-project/upload/part4/辛巳泣蕲录.txt
文件较小(98行),但每行较长(为连续叙述段落),需逐行grep定位。
Step 2:多轮grep -n
第一轮:核心词grep
grep -n '服色|舆服|冠服|章服|衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'
命中行号:1, 2, 3, 4, 5, 7, 8, 9, 10, 12, 13, 14, 15, 17, 18, 19, 20, 21, 22, 25, 26, 28, 29, 30, 32, 33, 34, 35, 37, 40, 41, 43, 80
大量命中因"衣""带""布"等高频字出现在非服饰语境(如"衣甲""布袋""地带"等),需二次筛选。
第二轮:制度词grep
grep -n '赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'
命中:L80(追赐紫章服)
仅1处命中制度词,本书非制度文献,服饰信息散见于战事实录。
第三轮:装饰词grep
grep -n '黼黻|文章|纹|绣|织|染|彩|画'
命中:L3(织出现在非服饰语境),装饰词在本书中几乎无直接命中。
第四轮:动作词grep
grep -n '服|冠|戴|穿|著|被|披|裹|束|系'
命中行号极多(服、被、著等高频字),需人工二次筛选服饰语境。
第五轮:专用服饰词grep(精准筛选)
grep -n '袍|裘|兜鍪|兜牟|铁甲|皮甲|软缠|毡|蓑衣|草鞋|皮靴|朝服|紫章服|绿布衫'
精准命中行号:3, 4, 5, 7, 8, 9, 10, 13, 17, 20, 21, 25, 29, 30, 32, 33, 37, 40, 80
Step 3:sed提取关键片段
| 行号 | sed命令 | 提取内容 |
|---|---|---|
| L3 | sed -n '3p' | rg -o '纸兜鍪[^。]*。' |
纸兜鍪一千副 |
| L3 | 同上 | 铁甲大小共有五百副,兜鍪五百二十副 |
| L4 | sed -n '4p' | rg -o '纸兜牟[^。]*。' |
纸兜牟一千副,纸软缠五百副 |
| L5 | sed -n '5p' | rg -o '着[绿白]布袍' |
着绿布袍/着白布袍 |
| L7 | sed -n '7p' | rg -o '软缠[^,]*' |
软缠一副 |
| L8 | sed -n '8p' | rg -o '皮甲[^,]*' |
皮甲数副 |
| L9 | sed -n '9p' | rg -o '衣服色号[^。]*。' |
衣服色号及年甲 |
| L9 | 同上 | 著软缠,干粮在腰 |
| L10 | sed -n '10p' | rg -o '蓑衣[^。]*。' |
身披蓑衣 |
| L13 | sed -n '13p' | rg -o '毡帘[^。]*。' |
毡帘遮护 |
| L17 | sed -n '17p' | rg -o '衣长甲[^。]*。' |
衣长甲军坐于交椅之上 |
| L20 | 批量提取 | 番笠、番毡、大小毡十五副、皮牌 |
| L21 | 批量提取 | 白布包头、着红衣、番毡九床 |
| L25 | 批量提取 | 衣朝服与在城寄居有官无官宗室 |
| L29 | 批量提取 | 销金鞍一副 |
| L30 | 批量提取 | 番绵裘五条、皮靴 |
| L32 | 批量提取 | 皮帘 |
| L33 | 批量提取 | 毡幔云梯、毡连头面裹其体 |
| L37 | 批量提取 | 绿布衫、身衣军服、擐甲登城、湿毡 |
| L40 | 批量提取 | 白袍犹未脱体 |
| L80 | 批量提取 | 紫章服(两处)、银绢二百匹两 |
Step 4:分类整理
经人工研判,剔除以下非服饰语境命中:
- "布袋""布幕":非服装,乃器物
- "麻搭""麻索":非服饰,乃攻守器具
- "铁菱角""皮大炮":军械,非服饰
- "丝""织"在非织物语境出现者
保留20条有效服饰条目,分五类整理:
- 官服与品色制度(4条)
- 军服与甲胄(13条)
- 金方服饰(9条)
- 民间与特殊服饰(6条)
- 纺织品与赏赐物(3条)
Step 5:产出文件
| 文件名 | 大小 | 内容 |
|---|---|---|
| 辛巳泣蕲录_总结.md | ~8KB | 分类总结与分析 |
| 辛巳泣蕲录_日志.md | 本文件 | 提取过程记录 |
| 辛巳泣蕲录_原文提取.md | ~10KB | 原文片段逐条提取 |