研究总结 日志 原文

十先生奥论注 服饰内容提取日志

基本信息

项目 内容
书名 十先生奥论注
文件路径 /home/z/my-project/upload/诗集/诗集/十先生奥论注.txt
输出目录 /home/z/my-project/upload/诗集output/十先生奥论注/
文件大小 981行 / 650,700字节
处理日期 2026-03-04

处理步骤记录

Step 1: 文件大小检查

wc -l -c 十先生奥论注.txt
# 结果:981行,650700字节

文件约650KB,行数不多但行极长(最长1030字符)。因UTF-8编码问题(文件末尾有截断字节),先用iconv修复:

iconv -f UTF-8 -t UTF-8 -c 十先生奥论注.txt > /tmp/ssxs_fixed.txt

Step 2: 5轮关键词grep

第1轮:核心词

关键词 匹配数 有效服饰条目
衣裳 1 1
衣冠 3 2
7 3
2 2
2 0
0 0
佩玉 1 1
玉带 0 0
6 2
0 0
0 0
12 0(皆"履行"等非服饰用法)
0 0
0 0
0 0
0 0
0 0
2 0
2 0
14 0

第2轮:材质词

关键词 匹配数 有效服饰条目
2 0
0 0
1 0
10 1
0 0
1 0
8 0
0 0
1 0
2 0
17 1
布衣 4 1
5 0
0 0

第3轮:色彩纹饰词

关键词 匹配数 有效服饰条目
紫绯 0 0
赐绯 0 0
20 1(朱紫)
14 1(青紫)
3 2
2 1

单字颜色词(白35、黄44、丹9等)全部为非服饰用法,未提取。

第4轮:制度词

关键词 匹配数 有效服饰条目
赐服 0 0
赐绯 0 0
章服 0 0
冠服 0 0
朝服 0 0
丧服 1 1(冠昏丧祭)
4 2(衮冕)
服制 0 0

"衮"4处中2处为"衮衮"(滚滚)用法,已排除。

第5轮:配饰词

关键词 匹配数 有效服饰条目
1 0
0 0
0 0
0 0
0 0
8 0
霞帔 0 0
云肩 0 0
佩鱼 0 0
幞头 0 0

Step 3: 补充搜索

# 官服品色
rg -n '青紫|朱紫|貂蝉|冠带|搢绅' /tmp/ssxs_fixed.txt
# 结果:约5条

# 赐服
rg -n '绶|赐.*衣|解衣|佩.*绶' /tmp/ssxs_fixed.txt
# 结果:约3条

# 礼制
rg -n '冠昏丧祭|垂衣裳|衮冕|黼黻' /tmp/ssxs_fixed.txt
# 结果:约5条

Step 4: 筛选与分类

根据提取结果:

Step 5: 对抗式审查

Step 6: 对比列朝诗集

维度 列朝诗集 十先生奥论注
有效服饰条目 350-400条 15-20条
具体服饰描写 大量
服饰哲学论述 1条(L462)
官服品色 丰富 少量
民族服饰 丰富
女性服饰 丰富
配饰 丰富 极少

输出文件

文件 说明
十先生奥论注_原文提取.md 按分类整理的服饰相关原文,约15-20条
十先生奥论注_总结.md 服饰内容分析总结
十先生奥论注_日志.md 本处理日志

统计摘要