《陶庵全集》服饰内容提取 · 操作日志
时间:2026-03-04 任务ID:batch18-5 来源:四库别集《陶庵全集》TXT(1854行)
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/陶庵全集
wc -l /home/z/my-project/upload/四库别集/陶庵全集.txt
# 结果:1854行
Step 2: 多轮grep搜索
第一轮:基础服饰词(衣裳裘冠冕弁帻巾帽袍衫裙裤褐衮绶佩笏带锦绮绢帛丝绸缎绫罗纱绉缟缁素)
grep -n '衣\|裳\|裘\|冠\|冕\|弁\|帻\|巾\|帽\|袍\|衫\|裙\|裤\|褐\|衮\|绶\|佩\|笏\|带\|锦\|绮\|绢\|帛\|丝\|绸\|缎\|绫\|罗\|纱\|绉\|缟\|缁\|素' 陶庵全集.txt
# 结果:226行(含大量噪音,如"丝竹""地带""带领"等)
第二轮:复合服饰词(冠服/舆服/章服/朝服/丧服/常服/赐服/蟒衣/飞鱼/补服/品色/鱼袋/革带/玉带/金带/幞头/乌纱/进贤冠/深衣/大带/蔽膝/霞帔/翟衣/蚕服/簪/钗/钿/珥/步摇/赤舄/绯/翠)
grep -n '冠服\|舆服\|章服\|朝服\|丧服\|常服\|赐服\|蟒衣\|飞鱼\|补服\|品色\|鱼袋\|革带\|玉带\|金带\|幞头\|乌纱\|进贤冠\|深衣\|大带\|蔽膝\|霞帔\|翟衣\|蚕服\|簪\|钗\|钿\|珥\|步摇\|赤舄\|绯\|翠' 陶庵全集.txt
# 结果:137行
第三轮:高精度复合词精准搜索
grep -n '衣冠\|衣裳\|布衣\|舆服\|章服\|朝服\|丧服\|常服\|赐服\|蟒衣\|飞鱼\|补服\|鱼袋\|玉带\|金带\|幞头\|乌纱\|进贤冠\|深衣\|大带\|蔽膝\|霞帔\|翟衣\|蚕服\|赤舄\|纶巾\|巾帻\|皮冠\|衣袂\|缁衣\|锦衣\|狐裘\|羔裘\|褐衣\|短褐\|脱簪\|金钿\|翟茀\|华簪\|章缝\|綦缟\|儒服\|戎服\|衣不解带\|夏葛冬裘\|裘葛\|赐犀\|释褐\|正衣冠\|冠带\|珰\|珥\|钿\|钗' 陶庵全集.txt
# 结果:38行(高信噪比)
第四轮:织物佩饰补充搜索
grep -n '冠带\|衣锦\|丝帛\|缣\|绡\|锦帐\|缟练\|绮\|绢\|帛\|绶\|佩\|带\|绂\|纮\|紞\|纩\|缨\|组' 陶庵全集.txt | grep -v '地带\|带兵\|带领\|丝管\|丝竹\|丝桐\|帛书'
# 结果:补充约80行
Step 3: 噪音过滤
排除规则:
- 丝竹、丝桐、丝管(乐器非织物)
- 地带、带兵、带领、带着(非服饰"带")
- 佩服、敬佩、钦佩(非服饰"佩")
- 素王、素问、素餐、素心、素位、素闻等("素"作副词/哲学概念非颜色)
- 履霜、履地、履中道("履"作动词非鞋履)
- 赤脚、赤侧(赤仄钱,非服色)
Step 4: 分类整理
将有效匹配按9大类归类:
- 衣冠与身份(13条)
- 冠服制度(6条)
- 冠帽与头饰(10条)
- 服饰与德行(5条)
- 丝织品与纺织(7条)
- 佩饰与仪容(9条)
- 足服(3条)
- 丧服与礼制(6条)
- 衣裳与行旅(2条)
共提取有效服饰条目 60条。
Step 5: 写入3个MD文件
| 文件 | 内容 | 大小 |
|---|---|---|
| 总结.md | 分类汇编+总结表 | ~8KB |
| 原文提取.md | 逐条原文+行号 | ~9KB |
| 日志.md | 本文件 | ~4KB |
关键发现
- 《陶庵全集》服饰内容以修身话语为主:正衣冠、冠帻、束带等均与理学修身密切相关,非制度性记载
- 布衣意象最为突出:出现3次以上,用于对比平民与官宦、德行与权位
- 女性服饰关联贞节贤德:鹿车布裳、剪发还鲊、脱簪、节衣缩食、綦缟乐贫,构成贤妇服饰话语群
- 丝织品多为文学比喻:缟练喻花、罗绮喻霞、缟带喻白鹦鹉飞舞,少有工艺性记载
- 冠服制度涉及政治评论:舆服僭越、章服不荣、赐犀未得,均指向制度失效与人才失意
- 赵武灵"奇服"论被专门讨论(行274):作者批评索隐将"长缨"释为"奇服",认为冠缨本为法服
- 无专门的舆服志或服制专章:所有服饰内容散见于序跋、书信、诗歌、笔记中
踩坑记录
- "丝"字匹配噪音极大(丝竹、丝桐等),需严格过滤
- "带"字同样噪音极大(地带、带兵、带领),必须用复合词搜索
- "素"字在古籍中多为副词/哲学概念(素王、素心),非颜色义
- "履"字多作动词(履中道、履地、履霜),非鞋履义
- "翠"字多作翠鸟/翠竹/翠色描写,非特指翠玉饰物
- 全书仅1854行,服饰有效内容约60条,密度较低
审核:全部原文均从grep -n提取,有明确行号对应,可溯源验证。