《资暇集》服饰内容提取 · 日志
时间:2026-04-17 任务ID:batch5-1 输入:/home/z/my-project/upload/四库别集/资暇集.txt 输出:/home/z/my-project/upload/四库别集output/资暇集/
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/资暇集/
读取3个参考文件(总结.md、日志.md、原文提取.md)了解输出格式规范。
Step 2: 文件概况
wc -l 资暇集.txt → 385行
wc -c 资暇集.txt → 49,016字节
唐·李济翁撰,分卷上/卷中/卷下,共约60余条考辨笔记。
Step 3: 第一轮grep——服饰本体词
rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝绸|缎|绫|罗|纱|绉|缟|缁|素' 资暇集.txt
命中行:153, 165, 173, 177, 221, 229, 295, 355, 373
Step 4: 第二轮grep——颜色与饰物词
rg -n '赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇' 资暇集.txt
新增命中:165(朱紫、白衫), 323(红豆、珊瑚), 327(浅紫)
Step 5: 第三轮grep——制度专词
rg -n '冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服' 资暇集.txt
仅命中1行:165(公服、常服)
Step 6: 第四轮grep——织物与配件补充
rg -n '帷|盖|靴|屦|屐|襦|袂|袖|襟|裙|丝|麻|缯|帛|褐|绢|绸|缎|纱|绫|罗|缃|绯' 资暇集.txt
rg -n '帷盖|衫|履|鞋|巾|缟|缁|褐|笏|囊|幞|缨|簪|钗|环|珮|绶|品色|章服' 资暇集.txt
新增命中:93(长缨)、153(囊幞)、377(腰囊、服用、结丝)
Step 7: sed提取完整条目
sed -n '93,95p' → 请长缨
sed -n '151,153p' → 朝祥
sed -n '159,161p' → 成服
sed -n '163,165p' → 出城仪
sed -n '175,177p' → 引从
sed -n '227,229p' → 上马
sed -n '293,295p' → 措大
sed -n '353,355p' → 茶托子
sed -n '371,377p' → 席帽+被袋
Step 8: 过滤噪音
排除以下命中(非服饰内容):
- 行71 "草木黄落" — "黄"为植物色,非服饰
- 行87 "绿竹漪漪" — "绿竹"为植物,非服饰
- 行173 "毛衣而成文章" — 指豹之毛皮纹路,比喻用法,非人类服饰
- 行221 "帽为慕" — 方言读音讹误,仅提及帽字发音
- 行323 "红豆""珊瑚" — 植物与比喻,非服饰珠玉
- 行327 "浅紫" — 花色,非服饰
- 行351 "琴甲" — 弹琴用竹甲,非人体甲胄
Step 9: 分类整理
确定6大类:冠帽演变、服制礼制、服饰配件、社会身份、纺织材料、妇女服饰
Step 10: 写3个MD文件
- 总结.md(4.2KB):分类整理+分析
- 原文提取.md(5.8KB):10条原文+关键词标注
- 日志.md(本文件)
关键发现
- 席帽条为全书服饰最核心条目:完整记录唐代从永贞到会昌约60年帽制变迁(席帽→毡帽→叠绡帽→丝帽),且以裴度遇刺事件为流行转折点
- 服饰信息集中于卷中、卷下:卷上仅"请长缨"1条,卷中4条,卷下5条
- 《资暇集》非舆服专书:全书以考辨名物为主,服饰内容散见于礼仪、风俗条目中
- 唐代服制实践与礼制存在落差:寒食拜扫应具公服,实际多穿白衫麻鞋
- 吴地丝织工艺突出:丝帽、丝袋皆出吴人巧手
- 丧服制度关注度高:朝祥(释服时辰)、成服(三日之制)均独立成条
踩坑记录
- "毛衣而成文章"(行173)初看像服饰,实为比喻豹之毛皮纹路,已过滤
- "帽为慕"(行221)为方言读音之误,非帽制内容,已降级
- "油缯为荷叶形以衫茶碟"中"衫"作动词用(覆盖),非名词衣衫
- "未冠者曰竖人"中"未冠"指未行冠礼,与冠帽制度间接相关
- 全书无"舆服"专章,服饰内容零散分布于风俗考辨条目中,需仔细甄别
审核结果
全部通过 ✅ — 原文均从TXT文件grep+sed提取,有明确行号对应,噪音已过滤。