《资暇集》服饰内容提取 · 日志

时间:2026-04-17 任务ID:batch5-1 输入:/home/z/my-project/upload/四库别集/资暇集.txt 输出:/home/z/my-project/upload/四库别集output/资暇集/


操作流程

Step 1: 环境准备

mkdir -p /home/z/my-project/upload/四库别集output/资暇集/

读取3个参考文件(总结.md、日志.md、原文提取.md)了解输出格式规范。

Step 2: 文件概况

wc -l 资暇集.txt → 385行
wc -c 资暇集.txt → 49,016字节

唐·李济翁撰,分卷上/卷中/卷下,共约60余条考辨笔记。

Step 3: 第一轮grep——服饰本体词

rg -n '衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛|丝绸|缎|绫|罗|纱|绉|缟|缁|素' 资暇集.txt

命中行:153, 165, 173, 177, 221, 229, 295, 355, 373

Step 4: 第二轮grep——颜色与饰物词

rg -n '赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇' 资暇集.txt

新增命中:165(朱紫、白衫), 323(红豆、珊瑚), 327(浅紫)

Step 5: 第三轮grep——制度专词

rg -n '冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服' 资暇集.txt

仅命中1行:165(公服、常服)

Step 6: 第四轮grep——织物与配件补充

rg -n '帷|盖|靴|屦|屐|襦|袂|袖|襟|裙|丝|麻|缯|帛|褐|绢|绸|缎|纱|绫|罗|缃|绯' 资暇集.txt
rg -n '帷盖|衫|履|鞋|巾|缟|缁|褐|笏|囊|幞|缨|簪|钗|环|珮|绶|品色|章服' 资暇集.txt

新增命中:93(长缨)、153(囊幞)、377(腰囊、服用、结丝)

Step 7: sed提取完整条目

sed -n '93,95p'  → 请长缨
sed -n '151,153p' → 朝祥
sed -n '159,161p' → 成服
sed -n '163,165p' → 出城仪
sed -n '175,177p' → 引从
sed -n '227,229p' → 上马
sed -n '293,295p' → 措大
sed -n '353,355p' → 茶托子
sed -n '371,377p' → 席帽+被袋

Step 8: 过滤噪音

排除以下命中(非服饰内容):

Step 9: 分类整理

确定6大类:冠帽演变、服制礼制、服饰配件、社会身份、纺织材料、妇女服饰

Step 10: 写3个MD文件


关键发现

  1. 席帽条为全书服饰最核心条目:完整记录唐代从永贞到会昌约60年帽制变迁(席帽→毡帽→叠绡帽→丝帽),且以裴度遇刺事件为流行转折点
  2. 服饰信息集中于卷中、卷下:卷上仅"请长缨"1条,卷中4条,卷下5条
  3. 《资暇集》非舆服专书:全书以考辨名物为主,服饰内容散见于礼仪、风俗条目中
  4. 唐代服制实践与礼制存在落差:寒食拜扫应具公服,实际多穿白衫麻鞋
  5. 吴地丝织工艺突出:丝帽、丝袋皆出吴人巧手
  6. 丧服制度关注度高:朝祥(释服时辰)、成服(三日之制)均独立成条

踩坑记录

审核结果

全部通过 ✅ — 原文均从TXT文件grep+sed提取,有明确行号对应,噪音已过滤。