《陆士龙集》服饰内容提取 · 操作日志
时间:2026-03-04 任务ID:batch16-1 操作:提取《陆士龙集》全部服饰相关内容,分类整理
操作流程
Step 1: 环境准备
mkdir -p /home/z/my-project/upload/四库别集output/陆士龙集
wc -l 陆士龙集.txt → 709行
Step 2: 读取参考文件
读取 参考总结.md(吕氏春秋)、参考日志.md(晋会要)、参考原文提取.md(天工开物)
→ 确认3个MD格式:总结(分类分析)、日志(操作记录)、原文提取(逐条原文)
→ 均需≤20KB
Step 3: grep多轮搜索(5轮)
第1轮:基础衣物类
grep -n "衣|裳|裘|冠|冕|弁|帻|巾|帽|袍|衫|裙|裤|褐"
→ 命中行:51,55,61,65-66,102,125,157,159,217,220,222,245,267,269,297,299,301,397,401,462,464-468,495,499,504-505,507,511,514,516,531,537,539,541,543,547,563,643,656,689,709
第2轮:材质与色彩类
grep -n "衮|绶|佩|笏|带|锦|绮|绢|帛|丝|绸|缎|绫|罗|纱|绉|缟|缁"
→ 新增命中:222,267,269,301,403,411,465,502,505,539,656,689,709
第3轮:色彩与饰品
grep -n "素|赤|青|黄|白|黑|朱|紫|绯|绿|翠|金|银|玉|珠|簪|钗|钿|珥|步摇"
→ 命中极多(大量文学用字如"素""白""金"等),需人工过滤
→ 有效命中:48(投簪),51(被褐),55(黄裳振素),66(朱衮/玉/金),125,176(玉帛),220(玄冕),267,269(缟带),462(重紫/白屋),465(青绂/玉/貂),467,511(轻裘),516(玄貂/华蝉/青),539(玉藻/素),563,656(玉),709(帛绳)
第4轮:具体服制术语
grep -n "衮衣|衮服|衮龙|玄冕|貂蝉|貂珰|紫黻|绶章|佩玉|黼黻|龙章|绣裳|缛藻|藻裳|华黻|朱衮|玉藻|缟带|鞶带|褧裳|褐衣|短褐|介帻|平天冠|远游冠|手衣|缞绖|帛绳"
→ 精确命中核心服饰条目
第5轮:补充制度词汇
grep -n "冠服|舆服|章服|朝服|戎服|被褐|投簪|投弁|释绂|解绂|披褐|袨服|袭宠|双组|式带|纡组|垂缨|振缨|弹冠|缙绅|搢绅|冠盖|白屋|绣文|组华|端委"
→ 补充制度性词汇,完善分类
Step 4: 噪音过滤
以下类型已排除:
- "素""白""金""玉"等字的文学修辞用法(如"素灵""白日""金虎""玉衡"非服饰)
- "衣"字用于"衣冠"之外的引申义(如"衣被"=覆盖恩泽)
- "裳"字在"裳服"外的文学化用(如"裳"仅作韵脚)
- 建筑装饰(绮寮、绮疏、朱户)归入建筑类,不归服饰
- "襁褓"仅一词出现,无展开内容
Step 5: 分类整理
按10大类归整:
- 冠冕制度(玄冕、平天冠、远游冠、冕弁、貂蝉金珰)
- 衮服与章服(衮衣、朱衮、黼黻、衮龙、绣文于裳)
- 绶带与佩饰(绶章、紫黻、鞶带、缟带、青绂、佩玉、琮璜)
- 衣裘与裳服(被褐、短褐、羔裘、珍裘、锦衣、藻裳、戎衣)
- 冠服中的貂蝉金珰(貂蝉、玄貂左珥、华蝉右顾)
- 头巾与帻(介帻、玄弁)
- 丧服与特殊服饰(缞绖、帛绳缠须、手衣)
- 冠服与政治地位(轩冕、端委、冠盖、搢绅、白屋)
- 逸民服饰哲学(被褐怀玉、轻裘对黻冕、释短褐服龙章)
- 神游想象中的冠服(振华冕之玉藻)
Step 6: 保存三份文件
- 总结.md(分类分析,约8KB)
- 日志.md(本文件)
- 原文提取.md(逐条原文摘录)
关键发现
- 曹操遗物记录(L563):介帻、平天冠、远游冠、手衣——为魏晋冠服实物之珍贵记录
- 寒蝉赋(L66):全书服饰密度最高之篇,以蝉拟人描写玄冕、朱衮、紫黻、佩玉、貂蝉全套朝服
- 晋代官服制度:玄冕衮衣+紫黻貂蝉+青绂组绶+鞶带佩玉的组合结构清晰
- "玄貂左珥华蝉右顾"(L516):具体描写侍中常侍冠饰,左貂右蝉,与《晋书·舆服志》可互证
- 手衣:手套之古称,早期文献记录
- 帛绳缠须:张华以丝绳缠胡须为饰,为独特个人装饰
- 被褐怀玉/释短褐服龙章:隐逸与仕进之服饰对比,贯穿全书之核心意象
踩坑记录
- "素""白""金""玉"等字在文学作品中出现频率极高,大量为非服饰用法,必须逐条人工判断
- 四库本使用大量异体/避讳字(如""代"玄"""代不可辨认字),grep时需注意
- 部分服饰词汇兼具本义与引申义(如"冠盖"既指冠服车盖,也指达官贵人),需区分
- "衣"字引申用法多("衣被万方""衣锦还乡"等),需结合语境判断