研究总结 日志 原文

《满清外史》服饰内容提取 — 操作日志

日期:2026-03-04 任务:提取《满清外史》全部服饰相关内容,整理分类总结


Step 1: 文件基本信息

wc -l /home/z/my-project/upload/part3/满清外史.txt
# 结果:454行,83339字节(约83KB),中型文件

Step 2: 第1轮 grep — 核心服饰词

rg -n '衣|冠|袍|裘|带|佩|巾|帽|靴|鞋|袜|褂|领|袖|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|披|氅|朝服|公服|常服|吉服|丧服|戎服|赐服|蟒衣|补服|弁|盔|胄|缨|纹|黼|黻|法服|燕服|深衣' /home/z/my-project/upload/part3/满清外史.txt
# 结果:约25行命中(含非服饰语境命中)
# 关键行号:38, 58, 94, 108, 114, 124, 150, 162, 194, 212, 218, 242, 270, 296, 306, 346, 406, 412, 416

Step 3: 第2轮 grep — 制度动作词+清代专项词

rg -n '剃发|易服|衣冠|龙衣|汉服|蟒缎|顶戴|花翎|马褂|朝服|朝珠|旗装|旗袍|发辫|辫发|十不从|男从女不从|赐服|赐紫|赐绯|僭|逾制|品色|冠礼|加冠|黄马褂|翎子|补服' /home/z/my-project/upload/part3/满清外史.txt
# 结果:9行命中
# 行102: 十不从(关键!)
# 行114: 衣冠、剃发
# 行150: 朝服
# 行194: 衣冠、汉服
# 行270: 僭(和珅穿御服)
# 行346: 龙衣
# 行406: 衣冠
# 行412: 蟒缎

Step 4: 第3轮 grep — 按需扩展

前两轮已覆盖主要服饰内容,第三轮无需额外扩展搜索。

Step 5: 排除审查

行号 匹配词 语境 判定
194 "衣冠" "衣冠雀起"=人材辈出 ❌排除(人材义)
260 "倡优" "倡优蓄之"=以倡优待之 ❌排除(比喻义)
其余 ✅保留

有效命中:21条

Step 6: sed 关键段落提取

sed -n '102,102p' 满清外史.txt   # 十不从
sed -n '194,194p' 满清外史.txt   # 乾隆穿汉服
sed -n '270,270p' 满清外史.txt   # 和珅穿御服
sed -n '346,346p' 满清外史.txt   # 织办龙衣
sed -n '412,412p' 满清外史.txt   # 蟒缎赐予

操作流程轨迹

文件确认(454行/83KB) → 第1轮grep核心词(约25行命中) → 第2轮grep制度+清代专项(9行命中)
→ 排除审查(排除2条误命中,保留21条有效)
→ 分类整理 → 产出3MD