研究总结 日志 原文

《翠屏集》服饰内容提取 · 操作日志

时间:2026-03-05 任务:提取《翠屏集》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/四库别集/翠屏集.txt(2247行) 输出目录:/home/z/my-project/upload/四库别集output/翠屏集/


操作流程

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/翠屏集/

Step 2: 读取参考模板

Step 3: 确认源文件规模

wc -l 翠屏集.txt → 2247行

Step 4: 第一轮grep——服饰核心词

grep -n '衣|裳|冠|冕|弁|帻|巾|帽|袍|裘|褐|裙|衫|袂|领|袖|履|屦|舄|靴|袜|带|绶|佩|笏|簪|钗|缨|黼|黻|绣|锦|绮|绫|罗|缎|绢|纱|缟|缣|帛|丝|绵|麻|葛|布|氅|蓑|甲|裈|襦|袄|褂|袈裟|帔' 翠屏集.txt

命中:198行

Step 5: 第二轮grep——精确复合词

grep -n '衣裳|衣冠|衮绣|衮服|布衣|锦袍|短褐|紫衣|朱衣|青衣|白衣|黄衣|玄衣|锦衣|绣衣|朝服|祭服|丧服|冠带|冠冕|皮弁|冕服|裘褐|罗衣|缁衣|绨袍|单衣|春衣|苎袍|貂裘|羊裘|狐裘|罗裙|纱帽|乌纱|纶巾|葛巾|羽衣|铢衣|袈裟|道袍|僧衣|蓑衣|甲裳|甲胄|铠甲|黼黻|补衮|衣锦|纫兰|佩兰|簪缨|缙绅|垂绅|文绣|章服' 翠屏集.txt

命中:55行(精确定位服饰实质内容)

Step 6: sed逐段提取

对55行中每条提取2-5行上下文,确认语境,共计提取约35个关键段落。

Step 7: 过滤非服饰用法

关键词 排除原因 行号
衣冠(L21序文) "衣冠"为士人代称,非服饰描写 21
敛袵(L66) "敛袵"为敛衽致敬,非服饰描写 66
释褐(L78) "释褐"为科举代称 78
章甫逢掖(L66) "逢掖"为儒服代称,序文套语 66
缉/丝/锦等比喻 非实质服饰 多处
组练(L392) 军阵代称 392
箕裘(L404) "克绍箕裘"为继承祖业代称 404
搢绅/荐绅(散见) 士大夫代称保留3处有服饰语境者
衣被(L1870) "衣被"为恩泽代称 1870
珰(L1128) "佩环珰"为文学意象 1128

过滤后保留有效服饰条目:约55条

Step 8: 分类整理

按8大类整理:

  1. 衣料织物与纺织(5条)
  2. 袍服(8条)
  3. 裘服(8条)
  4. 官服与朝仪(13条)
  5. 女性服饰(6条)
  6. 隐逸服饰(16条)
  7. 冠帽(6条)
  8. 服饰制度与礼制(4条)

Step 9: 撰写三份MD


关键发现

  1. 锦袍=李白文学符号——5见均绑定李白意象,此为元明题画诗固定传统
  2. 冠带=华夏文明南传——3见"冠带"均含"用夏变夷"意,与作者出使安南经历直接相关
  3. 隐逸服饰16种——构成布衣→葛巾→羽衣→铢衣的完整光谱,折射仕隐矛盾
  4. 《洗衣曲/辞》——鸦头袜、缃裙、罗衣、白苎春衣,为元明乐府中最精细的女性服饰劳动描写
  5. 冠礼三加之服(L2060)为全书唯一制度性服饰条目
  6. 全书无独立服饰专篇——所有服饰信息为诗歌意象与散文用典附属

关键踩坑记录


审核结果

全部通过 ✅