研究总结 日志 原文

《过庭录》服饰内容提取日志

基本信息

项目 内容
输入文件 /home/z/my-project/upload/part4/过庭录.txt
输出目录 /home/z/my-project/upload/44output/过庭录/
文件行数 240行
提取日期 2026-03-04
Task ID 25-a

提取过程

第一轮:wc -l 统计

240 /home/z/my-project/upload/part4/过庭录.txt

文件较小(240行),但仍严格遵守分步提取原则。

第二轮:多轮 grep -n 提取

2.1 制度词 + 服色类核心词

rg -n '服色|舆服|冠服|章服|赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'

命中行:89、135

2.2 服饰类核心词

rg -n '衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐'

命中行:5、21、25、45、73、75、77、79、89、95、99、115、121、131、135、139、149、181、217

(需过滤非服饰义项,如"衣"作"衣食"解等)

2.3 面料类核心词

rg -n '帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'

命中行:25、39、73、77、89、95、131、133、141、145、171、181、199

2.4 装饰词

rg -n '黼黻|文章|纹|绣|织|染|彩|画'

命中行:5、21、23、39、89、145、165、183、185、191、193、199、201

(大量"画"为绘画语境,非服饰装饰,需严格甄别)

2.5 动作词

rg -n '服|冠|戴|穿|著|被|衣|披|裹|束|系'

命中行:5、25、27、29、31、35、39、45、49、51、61、63、69、73、75、77、79、89、91、95、99、101、103、109、111、115、121、125、129、131、139、151、153、161、163、169、171、173、181、191、195、199、233

(大量"服"为"服中""释服""悦服"等非服饰义项,需逐一甄别)

第三轮:补充精准检索

rg -n '皮鞋|朝服|公裳|布衾|布被|珠履|红裀|绯衣|黄袍'
rg -n '释服|服中|除服|丧服|素服|朝服|公服|官服|祭服|常服'

精准命中行:5、23、31、63、69、95、121、135、149、173

去重与甄别结果

经多轮提取、去重、义项甄别后,确认服饰相关有效条目共20条,涉及行号:

5、23、25、31、39、63、69、73、75、77、79、89、95、115、121、131、135、139、145、149、173、181、199

其中核心服饰条目(直接涉及服饰制度、穿着、面料者)18条。

甄别原则

  1. "服"字甄别:排除"悦服""钦服""佩服""制服""衣服何患"等非服饰义项;保留"释服""服中""除服""朝服""公裳"等丧服/官服义项
  2. "衣"字甄别:排除"衣食""行色"等泛指;保留"衣锦""布袍""白麻衣""罗衣""绯衣""衣服鲜洁"等服饰义项
  3. "冠"字甄别:排除"冠绝""冠军"等;保留"挂冠""冠盖""冠带"等
  4. "画"字甄别:本书记载书画颇多,"画"多为绘画语境,仅保留"画壁"中涉及服饰描绘者(行89幞头画壁)
  5. "锦"字甄别:排除"昼锦堂"等非服饰用锦

分类统计

类别 条目数 行号
官服制度 3 135、149、173
丧服礼制 3 5、63、69
日常服饰 6 31、77、79、121、131、199
冠带礼节 3 73、75、139
织物面料 3 25、39、145
被服生活 2 95、115

产出文件

文件名 说明
过庭录_总结.md 服饰内容分类总结
过庭录_日志.md 提取过程日志(本文件)
过庭录_原文提取.md 服饰相关原文逐条提取