研究总结 日志 原文

《蓝山集》服饰内容提取 · 操作日志

时间:2026-04-19 任务:提取《蓝山集》全部服饰相关内容,整理分类总结 约束:严禁整本载入LLM,使用grep -n + sed提取


操作流程

Step 1: 环境准备

mkdir -p /home/z/my-project/upload/四库别集output/蓝山集/

确认源文件:

Step 2: 参考模板阅读

阅读3个模板文件:

Step 3: 文献基本信息提取

sed -n '1,30p' 蓝山集.txt

结果:

Step 4: 关键词搜索

第一轮:宽泛搜索

grep -n "衣|裳|冠|冕|裘|袍|衫|裙|带|履|佩|绶|簪|笏|弁|褐|缨|帻|襦|袂|袴|裾|褂|氅|蓑|靴|袜|帷|纱|绫|罗|缎|绢|锦|绣|丝|帛|布|麻|葛|缟|绮|纨|絮|绵|纩|缊" 蓝山集.txt

结果:120行匹配

第二轮:精准搜索(排除常见非服饰用法)

grep -n "短褐|被褐|布衣|儒衣|荷衣|缊袍|彩衣|铁冠|箨冠|角巾|乌巾|幅巾|蓑笠|葛巾|草衣|锦裳|羽衣|狐裘|征衣|衣冠|衣裳|衣褐|袍|衫|裙|裳|冠|弁|履|绶|簪|笏|氅|蓑|靴|袜|帷|纱|绫|罗|锦|绣|纨|缟|绮|帛|纩|缊" 蓝山集.txt

结果:76行匹配

第三轮:上下文提取

grep -n -B2 -A2 [关键词] 蓝山集.txt

提取含服饰关键词的上下文片段,确保不遗漏。

Step 5: 诗题映射

使用Python脚本将含服饰关键词的行映射至对应诗题:

Step 6: 分类整理

按10大类整理:

  1. 贫士之服(短褐·被褐·缊袍)——8处
  2. 儒者之服(儒衣·儒冠·冠弁·朝冠)——7处
  3. 隐士之服(荷衣·角巾·幅巾·乌巾)——7处
  4. 冠帽类(箨冠·铁冠·大帽宽衫)——3处
  5. 孝亲之服(彩衣·彩服·莱衣)——4处
  6. 时令之服(秋衣·冬衣·春衣)——4处
  7. 仙道之服(草衣·羽衣·鹤氅·云锦裳)——5处
  8. 渔樵之服(蓑·蓑笠)——3处
  9. 丧祭服饰(空衣·画衣)——4处
  10. 丝织品与其他(纨·绫·锦·帷·范叔解衣等)——约15处

Step 7: 保存三份文件


关键发现

  1. 《蓝山集》服饰内容以贫士隐士之服为核心:短褐、缊袍、荷衣、角巾反复出现,占全部服饰描写的半数以上,与蓝仁半生隐逸的经历高度吻合。

  2. 服饰描写高度程式化:每类服饰皆配合固定意象群——缊袍配"歌骚""野人",角巾配"藜杖""草堂",荷衣配"泉石""茅屋",几成公式。

  3. 缺乏制度性服饰记载:全书无冕服、祭服、朝服体系性描述,无服色等级制度,与经部、史部文献截然不同。这是别集类文献的特点——服饰是诗歌意象而非制度记录。

  4. "衣"字用法多样:约50%的"衣"字用法并非指具体服饰,而是——

    • 动词用法:衣被(L890)、衣褐(L574)
    • 比喻用法:胜衣(L1207)
    • 典故用法:莱衣(L1289)、彩衣(L184)
    • 泛指:冬衣(L142)、春衣(L1121)、秋衣(L476/L1447)
  5. 仙人服饰与贫士服饰形成对照:云锦裳/龙衮/羽衣 vs 短褐/缊袍/敝衣,天上人间之反差是蓝仁游仙诗的典型手法。

  6. 蓝仁对服饰的态度:以贫寒为荣,以隐逸为高。"缊袍自爱野人从""终老荷衣分所安"——服贫士之服而安之,是其人格写照。


关键踩坑记录

  1. "衣"字泛滥:grep搜"衣"返回120行,大量为非服饰用法(如"衣被生灵""不胜衣""衣襟泪不干"),需逐一甄别。

  2. 诗题识别困难:蓝山集为四库馆臣从永乐大典辑出,原文无明确诗题格式,标题行与诗句行格式相似,需用"短行+后跟空行"的启发式规则识别。

  3. 同字异义

    • "裘":狐裘(服饰) vs 菟裘(地名) vs 弓裘(继承)——三者皆出现
    • "绮":绮户(窗户) vs 绮里(人名)——非服饰义
    • "罗":虞罗(罗网) vs 罗浮(地名)——非服饰义
    • "锦":锦帆/锦浪(修辞) vs 云锦裳(服饰)
    • "帛":玉帛(礼器) vs 内府绫(实指织物)
  4. "空衣"需辨析:三处"空衣"皆非日常服饰,而是指僧道羽化后之衣冠葬品(衣冠冢),归入丧祭类。

  5. "帷""帷幄"非服饰:4处"帷/帷幄"皆指帐幕幕府,非帷裳(服饰),不应归入服饰类。