《西子湖拾翠余谈》服饰提取工作日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 西子湖拾翠余谈 |
| 作者 | 汪砢玉 |
| 时代 | 明末(万历—崇祯) |
| 源文件 | /home/z/my-project/upload/part4/西子湖拾翠余谈.txt |
| 输出目录 | /home/z/my-project/upload/44output/西子湖拾翠余谈/ |
| 总行数 | 142行 |
| 任务编号 | 20-b |
处理步骤
第1步:文件基本信息确认
- 执行
wc -l获取总行数:142行 - 文件为三卷结构:卷上(行1-58)、卷中(行59-68)、卷下(行69-142)
- 创建输出目录
第2步:多轮grep提取服饰行号
使用内置服饰关键词词库分5轮grep:
| 轮次 | 关键词类别 | 匹配行号 |
|---|---|---|
| 第1轮 | 制度词:服色/舆服/冠服/章服/赐服/赐紫/赐绯/借紫/品色/紫袍/绯袍/绿袍/金带/玉带/鱼袋/幞头/补服 | 54 |
| 第2轮 | 核心词:衣/裳/裘/冠/弁/佩/带/履/舄/笏/绶/冕 | 14, 25, 31, 54, 60, 61, 62, 65, 66, 68, 71, 75, 79, 81, 86, 91, 92, 98, 103, 107, 111, 112, 117, 120, 122, 125, 136 |
| 第3轮 | 织物词:袍/衫/裙/袄/褐/帛/绢/绫/罗/缎/锦/绮/纱/绸/丝/布/葛/麻/棉/茧/蚕 | 9, 16, 32, 54, 55, 61, 62, 63, 67, 68, 70, 71, 94, 106, 107, 116, 117, 120, 122, 125, 133, 138, 141 |
| 第4轮 | 装饰词:黼黻/文章/纹/绣/织/染/彩/画 | 9, 54, 55, 57, 61, 62, 63, 67, 68, 70, 71, 94, 106, 107, 116, 117, 120, 122, 125, 133, 138, 141 |
| 第5轮 | 动作词:穿/著/被/披/裹/束/系/戴/服 | 41, 46, 51, 54, 55, 57, 60, 61, 62, 65, 66, 67, 82, 92, 103, 105, 115, 122, 136 |
第3步:去重合并与人工筛选
合并5轮结果,去重后涉及行号:
- 全部命中行:9, 14, 16, 25, 31, 32, 41, 46, 51, 54, 55, 57, 60, 61, 62, 63, 65, 66, 67, 68, 70, 71, 75, 79, 81, 82, 86, 91, 92, 94, 98, 99, 100, 101, 102, 103, 105, 106, 107, 111, 112, 115, 116, 117, 120, 122, 125, 133, 136, 138, 141
人工筛选:去除以下误匹配(关键词出现在非服饰语境):
- 行9:游丝(非丝织品)、画(绘画非衣画)→ 排除
- 行16:茜桃(人名)→ 排除
- 行25:玉钩(器物非佩饰)→ 排除
- 行32:翠湿(自然景观)→ 排除
- 行41:名著仙经 → 排除
- 行46:不易(非服饰)→ 排除
- 行51:服饵(服药非穿服)→ 排除
- 行55:锦绣(比喻景观)、丹青(绘画)→ 保留"锦绣被磴"可参考
- 行57:披阅(翻阅非披衣)→ 排除
- 行60:襟带(比喻)、田衣(袈裟)→ 保留田衣、衣裾
- 行63:凝脂(比喻)、金鳞(比喻)→ 排除
- 行70:学绣(地名)→ 排除
- 行71:碧玉(堂名)→ 排除
- 行75:带壳(非衣带)→ 排除
- 行79:屏(屏风非衣屏)→ 排除
- 行81:葛粉(食用)→ 排除
- 行82:非服饰 → 排除
- 行86:扁舟 → 排除
- 行94:韈(文内翰赋中词,非纪实)→ 保留
- 行98:鳞次(比喻)→ 排除
- 行99-102:无直接服饰内容 → 排除
- 行105:非服饰 → 排除
- 行106:绘壁(壁画非衣纹)→ 排除
- 行111:烹粲(烹饪)→ 排除
- 行112:映带(比喻)→ 排除
- 行115:非服饰 → 排除
- 行116:画舫(船)→ 排除
- 行120:锦官城(地名)→ 排除
- 行122:如带(比喻)→ 排除
- 行125:绯桃(花名)→ 排除
- 行133:彩绘(船体装饰,非人体服饰)→ 保留参考
- 行136:如带(比喻)→ 排除
- 行138:学绣(地名)→ 排除
- 行141:非服饰 → 排除
筛选后有效行号:10, 14, 31, 54, 55(部分), 60(部分), 62, 65, 66, 67, 68, 91, 92, 94(部分), 103, 107, 117, 133(参考)
第4步:分类整理
按内容性质分为6类:
- 冠服制度与赐服(1条)
- 女性服饰妆容(9条)
- 僧道服饰(6条)
- 文人士夫服饰(3条)
- 佩饰与器物(3条)
- 织物与材料(散见8处)
第5步:产出3份MD文件
| 文件名 | 内容 | 大小控制 |
|---|---|---|
| 西子湖拾翠余谈_总结.md | 服饰内容分类总结与分析 | ≤20KB |
| 西子湖拾翠余谈_日志.md | 本文件,处理工作日志 | ≤20KB |
| 西子湖拾翠余谈_原文提取.md | 服饰相关原文摘录与注释 | ≤20KB |
注意事项
- 本书为游记性质,服饰内容均为旁涉,无系统性服饰论述
- 大量关键词命中但实际为比喻用法(如"襟带"、"如带"、"游丝"等),需人工甄别
- "锦绣被磴"、"丹青一新"等虽含织物词,但为比喻用法,未纳入核心服饰条目
- 部分织物词出现在诗文中,反映的是文学意象而非纪实性服饰描述
- 行94文内翰赋中"青林为韈"为仙山幻想描写,非现实服饰,但仍具参考价值
完成时间
2026年3月4日