《精华录》服饰内容提取 · 工作日志
时间:2026-03-05 任务ID:batch9-4 任务:处理《精华录》服饰内容整理 操作员:AI Agent
操作流程
Step 1: 准备工作
mkdir -p /home/z/my-project/upload/四库别集output/精华录/
- 创建输出目录成功
- 查阅参考模板:总结.md、日志.md、原文提取.md
Step 2: 源文件基本信息
wc -l 精华录.txt → 2919行
wc -c 精华录.txt → 322,140字节(约315KB)
- 文献:《钦定四库全书·集部七·别集类六·精华录》
- 撰者:[清] 王士祯
- 性质:诗歌别集(古体诗+今体诗)
Step 3: 服饰关键词频次统计
grep -c 搜索结果:
衣: 121 | 裳: 18 | 冠: 39 | 冕: 3 | 袍: 8 | 裘: 11
褐: 6 | 裙: 3 | 带: 39 | 佩: 8 | 绶: 1 | 笏: 19
履: 13 | 舄: 1 | 靴: 2 | 袂: 5 | 衿: 22 | 帻: 8
巾: 27 | 绮: 19 | 绫: 3 | 罗: 56 | 锦: 45 | 绢: 5
帛: 7 | 纱: 7 | 缟: 2 | 丝: 55 | 布: 33 | 衮: 4
弁: 1 | 旒: 2 | 绣: 17 | 黼: 1 | 黻: 1 | 深衣: 1 | 布衣: 3
Step 4: 关键词筛选与去重
- 初筛行数:282行含服饰关键词
- 大量"衣""带""丝""罗""锦"等为诗歌常用字,需逐一甄别
- 排除非服饰用例(如"衣"在"依""哀"等字中、地名"衣带水"等)
- 最终确认有效服饰相关行约90+行
Step 5: 分类提取
使用 sed -n 'Xp' 逐行提取关键片段,按以下类别整理:
- 白纻舞衣(5处)——南朝乐府意象
- 冠帽巾帻(15处+)——官职/隐逸/名士风度
- 衣裘袍服(30处+)——身份/境遇/僧道/行旅
- 霓裳女子(6处)——宫词/悼亡
- 丝绸织物(8处+)——贡赐/雅玩
- 带佩笏绶(10处+)——官仪/隐逸
- 衣冠政治(10处+)——兴亡之叹
- 蚕桑纺织(5处)——民生疾苦
- 屐履(6处)——行旅/隐逸
- 其他服饰意象(8处+)
Step 6: 产出三份文件
精华录_原文提取.md(约12KB)——按类分列原文,标注行号精华录_总结.md(约8KB)——分类总结+分析精华录_日志.md(本文件)
关键发现
- 本书为诗歌别集,无系统性服饰制度记载——所有服饰词语均为诗歌意象
- "衣冠"为最高频政治意象——出现10+次,几乎均与"失""虚""走"搭配,构成兴亡叙事
- 隐逸服饰意象突出——挂冠、角巾、鹿裘、水田衣、葛衣、拂衣等,反映清初文人归隐心态
- 白纻/霓裳为乐府传统延续——王士祯多次使用南朝乐府意象
- 貂裘高频出现(5次+)——与北方行旅、秋冬季节相关
- 蚕租行具有特殊价值——唯一直接反映服饰与民生关系的作品("鬻我嫁时襦""红锦裘"对比)
- 赐服/贡物记载——"越罗吴锦尚方来""紫貂裘""吴绫"反映清初宫廷赐服制度
- 僧道服饰自成系统——水田衣、方袍、坏色衣、绽衣构成完整的宗教服饰意象群
踩坑记录
- "衣"字泛化严重——121次出现中大量为非服饰用例(如"衣"在复合词中),需逐一甄别
- "带"字歧义多——39次出现中多数为"带领""地带"等非服饰含义
- "罗"字多为人名/地名——56次出现中"罗"多为姓氏或"罗列"义
- "锦"字多为地名/美称——45次出现中"锦城""锦江""锦屏"等为地名
- "丝"字多泛指——55次出现中多为"蚕丝""丝竹"等,非特指服饰
- 四库馆臣编纂格式——原文件无标点,诗句连写,需结合诗韵断句
- 异体字——"緼袍"即"缊袍","壊色衣"即"坏色衣","褏"即"袖"
质量检查
- 所有原文均有行号对应,可回溯验证
- 非服饰用例已排除(如"衣带水""锦城"等地理用例单独标注)
- 三份文件均未超过20KB
- 未整本载入LLM,仅使用grep/sed提取片段
- 如实记录:本书无系统服饰制度,均为诗歌意象