《筠谿集》服饰内容提取 · 工作日志
时间:2026-03-05 任务ID:batch8-1 任务:处理《筠谿集》服饰内容整理 操作员:AI Agent
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/筠谿集/
wc -l /home/z/my-project/upload/四库别集/筠谿集.txt
→ 2599行
Step 2: 读取参考模板
读取 /home/z/my-project/upload/参考/ 总结.md、日志.md、原文提取.md
→ 确认三文件模板格式
Step 3: 关键词检索(第一轮:统计频次)
检索特定服饰关键词出现次数:
衣冠:7, 衮:7, 袍:4, 裘:12, 帛:7, 绫:1, 罗:38, 绮:9, 绢:5,
锦:21, 绣:15, 纹:4, 绛:9, 绯:1, 簪:3, 巾:11, 帻:3, 弁:2,
襦:3, 褐:3, 舄:2, 履:36, 佩:14, 绶:4, 黼:1, 裙:1
Step 4: 关键词检索(第二轮:复合词精准匹配)
grep -n 搜索以下复合服饰词:
绣衣、章服、衣冠、褐衣、绯衣、衮衣、青衿、紫荷、皂盖、墨绶、
释褐、簮绂、轩冕、冠履、绅笏、绮罗、纶巾、羽扇、绛帐、绛縠、
缃帙、丹旐、朱衣、白氊、金印、罗韈、布衣、冠裾、征衫、锦衣、
罗帏、裘褐、赤舄、黄裳、白麻、貂裘、衣衾、缁衣、蚕、纺、
绢、纱、縠、缣、葛巾、缟素、从事衫、纱巾、乌帽、纨扇、
氊、绂、繻
Step 5: 关键词检索(第三轮:品级服饰词)
grep -n 搜索品级相关服饰词:
金紫、银青、紫衣、赐紫、赐绯、绯鱼、紫袍、墨绶、银鱼袋、
铜墨、犀带、笏头、鱼符、腰金、紫诰、紫泥、鱼书、虎符、节钺
Step 6: 筛选与分类
从全部匹配行中筛选出确有服饰实质内容的条目
排除:纯地名(如"罗城")、纯人名、非服饰语境(如"罗"作虚词)
保留:约60条有效服饰内容
按6大类整理:官服品级、士大夫衣冠、隐逸平民、诗词意象、丧葬、纺织
Step 7: 保存三份文件
筠谿集_原文提取.md → 9,570字节 (≤20KB ✅)
筠谿集_总结.md → 5,805字节 (≤20KB ✅)
筠谿集_日志.md → 本文件
关键发现
- 服饰内容总量中等偏少:全书2599行,有效服饰内容约60条,平均每43行1条
- 无系统服制论述:为诗文集而非典制书,无制度性专篇
- 制诰文贡献最大:弥逊任中书舍人所撰制词,使用大量前代官服典故
- "罗"字误判多:38个"罗"字匹配中,约半数为地名(罗城)、人名(罗孝芬、罗伟正)、虚词(张罗),实际服饰用例仅数条
- "履"字虚指多:36个"履"字匹配中,多为"践履""素履"等抽象义,实际鞋履义仅数条
- 靖康南渡诗最具文献价值:行850"衣冠困陵暴"为全书最深刻服饰书写
踩坑记录
- "罗"字高频但大量为非服饰用法(人名、地名),需逐条甄别
- "履"字多作"践履"(品行/实践义),非鞋履义
- "绣"字约半数为"绣壁""绣衣"之绣,前者非服饰
- "佩"字多作"佩服""钦佩"义,非佩饰义
- "青"字极高频但多非服饰(青山、青灯、青眼等),仅"青衿""青衫"为服饰
- "白""黄""紫""朱"等颜色词几乎全为非服饰语境,故未单独统计
审核结果
全部通过 ✅ — 原文均从筠谿集.txt中grep -n提取,有明确行号对应。非服饰语境条目已排除。