研究总结 日志 原文

《西子湖拾翠余谈》服饰提取工作日志

基本信息

项目 内容
书名 西子湖拾翠余谈
作者 汪砢玉
时代 明末(万历—崇祯)
源文件 /home/z/my-project/upload/part4/西子湖拾翠余谈.txt
输出目录 /home/z/my-project/upload/44output/西子湖拾翠余谈/
总行数 142行
任务编号 20-b

处理步骤

第1步:文件基本信息确认

第2步:多轮grep提取服饰行号

使用内置服饰关键词词库分5轮grep:

轮次 关键词类别 匹配行号
第1轮 制度词:服色/舆服/冠服/章服/赐服/赐紫/赐绯/借紫/品色/紫袍/绯袍/绿袍/金带/玉带/鱼袋/幞头/补服 54
第2轮 核心词:衣/裳/裘/冠/弁/佩/带/履/舄/笏/绶/冕 14, 25, 31, 54, 60, 61, 62, 65, 66, 68, 71, 75, 79, 81, 86, 91, 92, 98, 103, 107, 111, 112, 117, 120, 122, 125, 136
第3轮 织物词:袍/衫/裙/袄/褐/帛/绢/绫/罗/缎/锦/绮/纱/绸/丝/布/葛/麻/棉/茧/蚕 9, 16, 32, 54, 55, 61, 62, 63, 67, 68, 70, 71, 94, 106, 107, 116, 117, 120, 122, 125, 133, 138, 141
第4轮 装饰词:黼黻/文章/纹/绣/织/染/彩/画 9, 54, 55, 57, 61, 62, 63, 67, 68, 70, 71, 94, 106, 107, 116, 117, 120, 122, 125, 133, 138, 141
第5轮 动作词:穿/著/被/披/裹/束/系/戴/服 41, 46, 51, 54, 55, 57, 60, 61, 62, 65, 66, 67, 82, 92, 103, 105, 115, 122, 136

第3步:去重合并与人工筛选

合并5轮结果,去重后涉及行号:

人工筛选:去除以下误匹配(关键词出现在非服饰语境):

筛选后有效行号:10, 14, 31, 54, 55(部分), 60(部分), 62, 65, 66, 67, 68, 91, 92, 94(部分), 103, 107, 117, 133(参考)

第4步:分类整理

按内容性质分为6类:

  1. 冠服制度与赐服(1条)
  2. 女性服饰妆容(9条)
  3. 僧道服饰(6条)
  4. 文人士夫服饰(3条)
  5. 佩饰与器物(3条)
  6. 织物与材料(散见8处)

第5步:产出3份MD文件

文件名 内容 大小控制
西子湖拾翠余谈_总结.md 服饰内容分类总结与分析 ≤20KB
西子湖拾翠余谈_日志.md 本文件,处理工作日志 ≤20KB
西子湖拾翠余谈_原文提取.md 服饰相关原文摘录与注释 ≤20KB

注意事项

  1. 本书为游记性质,服饰内容均为旁涉,无系统性服饰论述
  2. 大量关键词命中但实际为比喻用法(如"襟带"、"如带"、"游丝"等),需人工甄别
  3. "锦绣被磴"、"丹青一新"等虽含织物词,但为比喻用法,未纳入核心服饰条目
  4. 部分织物词出现在诗文中,反映的是文学意象而非纪实性服饰描述
  5. 行94文内翰赋中"青林为韈"为仙山幻想描写,非现实服饰,但仍具参考价值

完成时间

2026年3月4日