研究总结 日志 原文

《精华录》服饰内容提取 · 工作日志

时间:2026-03-05 任务ID:batch9-4 任务:处理《精华录》服饰内容整理 操作员:AI Agent


操作流程

Step 1: 准备工作

mkdir -p /home/z/my-project/upload/四库别集output/精华录/

Step 2: 源文件基本信息

wc -l 精华录.txt → 2919行
wc -c 精华录.txt → 322,140字节(约315KB)

Step 3: 服饰关键词频次统计

grep -c 搜索结果:
衣: 121 | 裳: 18 | 冠: 39 | 冕: 3 | 袍: 8 | 裘: 11
褐: 6 | 裙: 3 | 带: 39 | 佩: 8 | 绶: 1 | 笏: 19
履: 13 | 舄: 1 | 靴: 2 | 袂: 5 | 衿: 22 | 帻: 8
巾: 27 | 绮: 19 | 绫: 3 | 罗: 56 | 锦: 45 | 绢: 5
帛: 7 | 纱: 7 | 缟: 2 | 丝: 55 | 布: 33 | 衮: 4
弁: 1 | 旒: 2 | 绣: 17 | 黼: 1 | 黻: 1 | 深衣: 1 | 布衣: 3

Step 4: 关键词筛选与去重

Step 5: 分类提取

使用 sed -n 'Xp' 逐行提取关键片段,按以下类别整理:

  1. 白纻舞衣(5处)——南朝乐府意象
  2. 冠帽巾帻(15处+)——官职/隐逸/名士风度
  3. 衣裘袍服(30处+)——身份/境遇/僧道/行旅
  4. 霓裳女子(6处)——宫词/悼亡
  5. 丝绸织物(8处+)——贡赐/雅玩
  6. 带佩笏绶(10处+)——官仪/隐逸
  7. 衣冠政治(10处+)——兴亡之叹
  8. 蚕桑纺织(5处)——民生疾苦
  9. 屐履(6处)——行旅/隐逸
  10. 其他服饰意象(8处+)

Step 6: 产出三份文件


关键发现

  1. 本书为诗歌别集,无系统性服饰制度记载——所有服饰词语均为诗歌意象
  2. "衣冠"为最高频政治意象——出现10+次,几乎均与"失""虚""走"搭配,构成兴亡叙事
  3. 隐逸服饰意象突出——挂冠、角巾、鹿裘、水田衣、葛衣、拂衣等,反映清初文人归隐心态
  4. 白纻/霓裳为乐府传统延续——王士祯多次使用南朝乐府意象
  5. 貂裘高频出现(5次+)——与北方行旅、秋冬季节相关
  6. 蚕租行具有特殊价值——唯一直接反映服饰与民生关系的作品("鬻我嫁时襦""红锦裘"对比)
  7. 赐服/贡物记载——"越罗吴锦尚方来""紫貂裘""吴绫"反映清初宫廷赐服制度
  8. 僧道服饰自成系统——水田衣、方袍、坏色衣、绽衣构成完整的宗教服饰意象群

踩坑记录

  1. "衣"字泛化严重——121次出现中大量为非服饰用例(如"衣"在复合词中),需逐一甄别
  2. "带"字歧义多——39次出现中多数为"带领""地带"等非服饰含义
  3. "罗"字多为人名/地名——56次出现中"罗"多为姓氏或"罗列"义
  4. "锦"字多为地名/美称——45次出现中"锦城""锦江""锦屏"等为地名
  5. "丝"字多泛指——55次出现中多为"蚕丝""丝竹"等,非特指服饰
  6. 四库馆臣编纂格式——原文件无标点,诗句连写,需结合诗韵断句
  7. 异体字——"緼袍"即"缊袍","壊色衣"即"坏色衣","褏"即"袖"

质量检查