《象山集·象山语录》服饰内容提取 · 日志
时间:2026-04-20 任务ID:batch3-4 输入:/home/z/my-project/upload/四库别集/象山集象山语录.txt 输出:/home/z/my-project/upload/四库别集output/象山集象山语录/
操作流程
Step 1: 检查文件基本信息
wc -l → 2211行
wc -c → 639,825字节(约625KB)
file → Unicode text, UTF-8, with very long lines, CRLF
Step 2: 读取参考文件
参考/总结.md → 吕氏春秋服饰总结格式(分类+引文+注释+表格)
参考/日志.md → 晋会要提取操作日志格式
参考/原文提取.md → 天工开物原文提取格式(分节+引文)
Step 3: 多轮grep搜索
第1轮:核心服饰词(衣冠/裘/冠/冕/弁/袍/衫/褐/绶/佩/笏/带/锦/绢/帛等)
rg -n "衣裳|裘|冠|冕|弁|帻|巾帽|袍|衫|裙|裤|褐|衮|绶|佩|笏|带|锦|绮|绢|帛..."
→ 命中多行,但大量为哲学用语噪音
第2轮:颜色/材质/首饰词
rg -n "赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗..."
→ 噪音极大("金/玉/白/青"等词在哲理性文字中大量出现)
→ 放弃此轮,改用更精确的服饰专词
第3轮:制度性服饰词
rg -n "冠服|舆服|章服|朝服|公服|祭服|丧服|常服|戎服|赐服|蟒衣|飞鱼|斗牛|补服|品色|鱼袋|革带|玉带|金带|幞头|乌纱|进贤冠|深衣|大带|蔽膝|舄|履|靴|袜|霞帔|翟衣|蚕服"
→ 命中极少,仅"鱼袋""玉带"有零星结果
第4轮:精确搜索
rg -n "短褐|裘葛|衣冠|缁|胡服|章甫|逢掖|佩玉|冠履|赐绯|象笏|衣裳|衣冦|正衣冠|儒冠"
→ 命中15处核心内容
第5轮:补充搜索
rg -n "朱衣|冕旒|丧祭|冠昏"
→ 补充3处
Step 4: 过滤噪音
- 排除"衮衮"(滚动义,非衮服)
- 排除"锦覆陷穽"(比喻义,锦=华美陷阱)
- 排除"金衣"(黄鹄刷金衣,指鸟羽,非服饰)
- 排除"佩玉"作地名者(佩玉涧)
- 保留比喻义但有服饰制度价值的条目(冠履倒置)
Step 5: 分类整理
按6大类整理:
- 儒释服饰之辨(胡服/缁衣 vs 衣冠)
- 衣冠作为文明与礼教象征
- 儒者服饰实物描写
- 丧祭朝仪中的服饰
- 服饰作为礼制修身工具
- 民间服饰状况
Step 6: 写3个MD文件
- 总结.md(分类总结+表格,约8KB)
- 原文提取.md(18条原文,约4KB)
- 日志.md(本文件,约3KB)
关键发现
- 服饰内容稀疏:全书2211行、64万字,服饰相关仅18条,是典型的"哲学集"而非制度文献
- 以象征义为主:衣冠多为文明/身份/秩序的象征,实物描写极少
- 儒释之辨的服饰维度:"胡服"与"衣冠"构成核心对立,是宋代理学家以服饰辨华夷、辨儒释的典型
- 正衣冠传统:陆氏兄弟坚持"正衣冠"讲学、病中亦然,体现理学家对服饰仪容的重视
- 朱衣象笏:语录中记载陆九渊"朱衣象笏"行礼,为宋代朝仪服饰实物记录
- 短褐裘葛:陆九皋行状中引杜甫诗描述贫士服饰,为宋代士人实际生活状况的旁证
- 冠履佩玉的修身功能:程文中系统阐述冠履佩玉作为"闲邪存诚"工具
关键踩坑记录
- 全文为极长行文本(最长行2229字符),grep结果难以定位段落
- "衣/冠/带/佩"等字在理学文献中大量出现为哲学用语(如"衣冠"="儒者","冠履"="秩序"),需逐一甄别
- "衮衮"在本集中出现多次但均为"连续不断"之义,与衮服无关
- "锦"在"名利如锦覆陷穽"中为比喻用法,非织锦实物
- "佩玉"有时指地名(佩玉涧),需区分
审核结果
全部通过 ✅ — 原文均从源文件grep提取,有明确行号对应,噪音已过滤。