《潏水集》服饰内容提取 · 日志
时间:2026-03-04 任务:提取《潏水集》全部服饰相关内容,整理分类总结 Task ID: batch-r3-e
操作流程
Step 1: 创建输出目录 & 查看行数
mkdir -p /home/z/my-project/upload/四库别集output/潏水集/
wc -l 潏水集.txt → 1289行
Step 2: 五轮grep -n扫描
| 轮次 | 关键词类别 | 命中行数(去重前) |
|---|---|---|
| 1 | 衣/裳/服/裘/袍/袂/裾/褐/衮/衿/裙/衫/帔/襦/短褐 | ~70行 |
| 2 | 冠/冕/弁/帽/巾/帻/簪/笄/珥/缨/佩/璜/玦/环/绶/带 | ~60行 |
| 3 | 帛/绢/绸/绫/罗/纱/缎/锦/缯/绮/缟/纨/练/绡/绣/缣 | ~40行 |
| 4 | 丝/蚕/麻/葛/茧/绵/棉/毳/氂/染/靛/朱/绯/赭/素/玄 | ~80行 |
| 5 | 履/屦/屐/鞋/靴/舄/袜/韈/韨/韠/章服/法服/朝服/祭服/丧服 | ~25行 |
Step 3: 交叉验证 & 精确grep
对初步筛选的高价值条目进行第二轮精确grep,关键词:
- 垂裳/绣衣/衣冠制度/胡服/冕服/冕衮/冠舄/绨袍/缊袍/絮帽/纨绮/紫绮/织流黄/缲丝/貂帽/朱冠/圆冠/丧服/蓑笠/脱巾/明珰/珠佩/舞衣/袍印/绶/冠切云
- 氊裘/被髪/椎结/文身/貂帽/纶巾/青衫/白纶
Step 4: 对抗式审查(过滤非服饰用法)
| 排除项 | 原因 |
|---|---|
| "衣食" | 泛指生活,非特指服饰 |
| "衣服器械" | 军需泛称 |
| "服习丰华" | 服习=习惯,非服饰 |
| "佩服" | 佩服=钦佩 |
| "服从" | 动词,非服饰 |
| "锦书" | 书信,非丝织服饰 |
| "锦鲤" | 鱼名 |
| "锦石" | 石名 |
| "锦囊" | 泛指书囊,非服饰本体 |
| "冠盖" | 代指仕宦,非冠帽实物 |
| "冠族" | 名门望族,非冠帽 |
| "佩刀" | 武器,非佩饰 |
| "履险" | 动词,非鞋履 |
| "步履/杖履" | 泛指行走,非鞋履实物 |
Step 5: 分类整理
8大类28条有效条目:
- 服饰制度与礼制 5条
- 冕服与祭祀 3条
- 官服与士人 7条
- 裘衣御寒 5条
- 丝织与织造 6条
- 文学典故服饰 10条
- 民俗征丁服饰 4条
- 佩饰 2条
Step 6: 撰写三份MD
- 潏水集_原文提取.md:28条,含行号引用与关键词加粗
- 潏水集_总结.md:6章,含核心发现5条
- 潏水集_日志.md:本文件
关键发现
- L342 唐初衣冠制度承周隋杂有胡服:全书最重要的服饰制度史料,揭示了唐代服饰从胡汉杂糅到汉化定型的演变
- L322 氊裘被髪椎结文身:《招魂》体中的异族服饰全景描写,四类异族特征并列
- L625 纽麻缠腰袍印字/两胫束布/头裹巾:极罕见的宋代征丁服饰实录
- L429 缲丝丝缕长当窗织流黄/不作舞衣裳:丝织品优先军用而非享乐的写实
- 裘衣高频出现(5条):反映作者西北戍边生活体验
关键踩坑记录
- "衣冠"在本书中大量出现,但多为"衣冠之士"的象征义(如"卓尔衣冠之盛事"),非服饰实体描写,须逐条甄别
- "绣衣"两次出现均为典故化用(汉代绣衣御史),非当时实际服制
- "锦"字出现极多(锦书、锦鲤、锦石、锦囊等),但绝大多数非服饰用法
- "履"字多用作动词(履险、步履、杖履),实际鞋履仅2条
- 全书1289行,服饰内容密度较低(28/1289≈2.2%),符合别集类古籍的一般特征
审核结果
全部通过 ✅
- 原文均从源文件grep提取,有明确行号对应
- 28条有效条目均经过对抗式审查,排除非服饰用法
- 三份MD文件均≤20KB
- 未加载整本TXT,未编造任何内容