研究总结 日志 原文

《臞轩集》服饰内容提取 · 操作日志

时间:2026-04-20 任务:提取《臞轩集》全部服饰相关内容,整理分类总结 源文件:/home/z/my-project/upload/四库别集/臞轩集.txt(1278行,434KB) 方法:grep -n + sed 提取上下文,严禁整本载入LLM


操作流程

Step 1: 创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/臞轩集/

✅ 成功

Step 2: 检查源文件

wc -l -c /home/z/my-project/upload/四库别集/臞轩集.txt
→ 1278行, 434457字节
file → Unicode text, UTF-8, with very long lines (7555), CRLF

Step 3: 查看参考模板

读取了3个参考模板:

Step 4: grep -n 搜索服饰关键词

第一轮:宽泛搜索

LC_ALL=C grep -c 统计各关键词行数

结果:

关键词 行数
70
16
32
7
1
14
32
10
1
2
1
13
13
12
7
17
4
5
36
16
23
7
8
14
5
1
15
4
7
17

注意:UTF-8编码问题,直接grep报错,改用 LC_ALL=C grep 和 Python处理。

第二轮:精确搜索(Python) 使用Python逐行搜索约90个服饰关键词组合,共命中81行含服饰关键词。

第三轮:深度筛选 对81行结果逐条审阅,排除以下类型:

最终确认约30处确有服饰实质内容的行。

Step 5: sed 提取上下文

对关键行使用Python(等效sed -n)提取前后文字,截取关键词前后60-250字不等的上下文片段。

Step 6: 分类整理

按内容性质分为12类:

  1. 宫廷服饰与奢侈风气
  2. 衮冕祭祀
  3. 赐服制度
  4. 绣衣使者
  5. 皮裘服饰
  6. 冠服与士大夫
  7. 履舄制度
  8. 印绶笏带
  9. 帝王节俭服制
  10. 隐士服饰与文学意象
  11. 服饰与政治象征
  12. 衣料与经济

Step 7: 保存三份文件


关键发现

  1. 《臞轩集》非服饰专书,服饰内容散见于策论、奏札、书启、诗歌中
  2. 行397的帝王节俭箴言是全书最系统的服饰制度记载,涉及蒲苇帘、罽绮、絁被、澣衣等
  3. **行541"君披貂毛裘,我着犊鼻裈"**是最生动的服饰对比描写
  4. 大量服饰词汇为典故化使用:鳬舄、貂裘、绣衣、纨袴、昼锦等
  5. 隐士服饰深受**《楚辞》传统**影响:芰衣、蕙纕、荷裳、兰佩
  6. 绣衣使者制度在汉代史论与南宋纪实中均有反映
  7. 南宋服饰奢侈风气(后宫服饰夕行民间)有直接记录

关键踩坑记录


审核结果

全部通过 ✅ — 原文均从源文件grep/sed提取,有明确行号对应。排除非服饰义项后,保留约30处有实质服饰内容的行,分12类整理。