研究总结 日志 原文

《裴子语林》服饰提取日志

任务信息

项目 内容
任务ID 22-b
输入文件 /home/z/my-project/upload/part4/裴子语林.txt
输出目录 /home/z/my-project/upload/44output/裴子语林/
执行时间 2026-03-05
文件总行数 372行

执行步骤记录

步骤1:文件概览

步骤2:多轮grep -n 提取

第1轮:制度词(服色|舆服|冠服|章服|赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服)

结果:0条匹配

说明:《裴子语林》为魏晋轶事小说,不涉及唐以后品色服制度,故制度词无匹配,符合预期。

第2轮:核心服饰词(衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐)

结果:命中32行(去重后24个独立行号),含较多动词用法"服"的误匹配(如"骇服""服而效之"等)

有效匹配行号(第一版):

排除误匹配:第12行(骇服=佩服)、第13行(冠=未冠,保留)、第14行(被头=披头)、第28行(被收=逮捕)、第31行(着械=戴枷)、第53行(婢服=顺从)、第62行(服而效之=效仿)、第87行(服从=顺从)、第95行(手版=笏板,边缘相关保留参考)、第105行(被=被子)、第106行(被=被动)、第144行(被囊=行囊)

第3轮:织物材料词(帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕)

结果:命中16行,有效提取:

第4轮:装饰词(黼黻|文章|纹|绣|织|染|彩|画)

结果:命中2行

装饰词匹配较少,说明本书侧重人物轶事而非服饰描写。

第5轮:动词词(服|冠|戴|穿|著|被|衣|披|裹|束|系)

结果:命中大量行,但动词误匹配率极高("服"≈佩服/顺从、"被"≈被动/逮捕/被子、"着"≈写书/"冠"≈冠军等)

有效动词匹配(已在前几轮覆盖):

步骤3:sed提取

对24个有效行号执行 sed -n 'Np' 提取完整原文,确认上下文无误。

步骤4:分类整理

将提取内容按四大类整理:

  1. 衣裳袍衫类(10项)
  2. 冠带巾帻类(8项)
  3. 织物材料与装饰类(6项)
  4. 服饰行为类(6项)

部分条目跨类(如第17行"戎服莅事"兼属衣类与行为类),按主要归类处理。

步骤5:产出文件

文件名 大小 内容
裴子语林_总结.md ≤20KB 分类总览、重点发现、数据统计
裴子语林_日志.md ≤20KB 本文件,完整执行过程记录
裴子语林_原文提取.md ≤20KB 原文逐条摘录与标注

质量检查

特殊说明

  1. 本书中"服"字多用作"佩服""服从"义,与服饰无关,需仔细甄别
  2. "被"字多用作被动标记或"被子"义,仅"锦被""被囊"为实物
  3. 制度词(赐服、赐紫、品色等)全部无匹配,因本书为晋代小说,远早于唐代品色服制度
  4. 第23行"黄绢幼妇"为文字游戏(拆字为"绝妙好辞"),"绢""丝"非实际服饰描写,但反映织物在汉魏日常认知中的普及