《裴子语林》服饰提取日志
任务信息
| 项目 | 内容 |
|---|---|
| 任务ID | 22-b |
| 输入文件 | /home/z/my-project/upload/part4/裴子语林.txt |
| 输出目录 | /home/z/my-project/upload/44output/裴子语林/ |
| 执行时间 | 2026-03-05 |
| 文件总行数 | 372行 |
执行步骤记录
步骤1:文件概览
wc -l结果:372行- 文件结构:前4行为书名标题("裴子语林 (晋)裴启 撰""●裴子语林")
- 关键发现:第5-184行为第一版正文,第189-372行为第二版重复正文(同一内容再录),两版文字略有差异
- 提取时以第一版行号为准,两版均有匹配者注出对应行号
步骤2:多轮grep -n 提取
第1轮:制度词(服色|舆服|冠服|章服|赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服)
结果:0条匹配
说明:《裴子语林》为魏晋轶事小说,不涉及唐以后品色服制度,故制度词无匹配,符合预期。
第2轮:核心服饰词(衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐)
结果:命中32行(去重后24个独立行号),含较多动词用法"服"的误匹配(如"骇服""服而效之"等)
有效匹配行号(第一版):
- 第9行:锦被(陈元方丧)
- 第10行:锦被、奋衣(傅信丧)
- 第13行:未冠(孔嵩)
- 第17行:戎服、葛巾(诸葛亮)
- 第25行:着粉、朱衣(何晏)
- 第27行:冠冕(夏侯玄)
- 第30行:黑单衣、皂带(嵇康遇鬼)
- 第44行:着黄皮裤褶(夏少明)
- 第52行:青衣(道真)
- 第65行:新衣、故衣(石崇厕)
- 第73行:葛巾、振衣(宋岱)
- 第75行:衣帻(晋明帝)
- 第77行:穿冠(温峤劝进)
- 第80行:带绝(王平子)
- 第102行:垂长衣(桓宣武)
- 第119行:紫罗襦(谢镇西)
- 第129行:练服(王导)
- 第131行:冠冕(丞相拜司空)
- 第140行:衣冠、弛冠解带(桓温)
- 第145行:裘、绵(谢万乞裘)
排除误匹配:第12行(骇服=佩服)、第13行(冠=未冠,保留)、第14行(被头=披头)、第28行(被收=逮捕)、第31行(着械=戴枷)、第53行(婢服=顺从)、第62行(服而效之=效仿)、第87行(服从=顺从)、第95行(手版=笏板,边缘相关保留参考)、第105行(被=被子)、第106行(被=被动)、第144行(被囊=行囊)
第3轮:织物材料词(帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕)
结果:命中16行,有效提取:
- 第9行:锦被
- 第10行:锦被
- 第17行:葛巾
- 第23行:黄绢、色丝(杨修解碑文字游戏)
- 第64行:绛纱帐、锦香囊、锦囊
- 第67行:绮丽、车服
- 第73行:葛巾
- 第119行:紫罗襦
- 第129行:粗练
- 第131行:冠冕("冕"含"帛"义,不属织物误匹配,保留原词)
第4轮:装饰词(黼黻|文章|纹|绣|织|染|彩|画)
结果:命中2行
- 第67行:绮丽(以饰车服)
- 第65行:藻饰
装饰词匹配较少,说明本书侧重人物轶事而非服饰描写。
第5轮:动词词(服|冠|戴|穿|著|被|衣|披|裹|束|系)
结果:命中大量行,但动词误匹配率极高("服"≈佩服/顺从、"被"≈被动/逮捕/被子、"着"≈写书/"冠"≈冠军等)
有效动词匹配(已在前几轮覆盖):
- 着葛巾(第17行)、着粉(第25行)、着黄皮裤褶(第44行)
- 着新衣(第65行)、着紫罗襦(第119行)
- 穿冠(第77行)
- 弛冠解带(第140行)
- 奋衣(第10行)、振衣(第73行)
步骤3:sed提取
对24个有效行号执行 sed -n 'Np' 提取完整原文,确认上下文无误。
步骤4:分类整理
将提取内容按四大类整理:
- 衣裳袍衫类(10项)
- 冠带巾帻类(8项)
- 织物材料与装饰类(6项)
- 服饰行为类(6项)
部分条目跨类(如第17行"戎服莅事"兼属衣类与行为类),按主要归类处理。
步骤5:产出文件
| 文件名 | 大小 | 内容 |
|---|---|---|
| 裴子语林_总结.md | ≤20KB | 分类总览、重点发现、数据统计 |
| 裴子语林_日志.md | ≤20KB | 本文件,完整执行过程记录 |
| 裴子语林_原文提取.md | ≤20KB | 原文逐条摘录与标注 |
质量检查
- 未加载整本TXT进入LLM(仅用grep+sed提取片段)
- 服饰关键词使用内置词库
- 3份MD每份≤20KB
- 未偷懒简写批量合并(每条原文独立列出)
- 误匹配已人工排除(如"骇服""被收"等)
- 重复版本已标注(文件含两版同一内容)
特殊说明
- 本书中"服"字多用作"佩服""服从"义,与服饰无关,需仔细甄别
- "被"字多用作被动标记或"被子"义,仅"锦被""被囊"为实物
- 制度词(赐服、赐紫、品色等)全部无匹配,因本书为晋代小说,远早于唐代品色服制度
- 第23行"黄绢幼妇"为文字游戏(拆字为"绝妙好辞"),"绢""丝"非实际服饰描写,但反映织物在汉魏日常认知中的普及